Keresés

Új hozzászólás Aktív témák

  • sb

    veterán

    válasz dokanin #11 üzenetére

    Amiért nem veszel 16 hengeres autót otthonra? Pedig pályanapra évente 1x jó lenne.
    Vagy amiért lekapcsol 4 henger a 8-ból?

    Amiről te írsz a brute force megoldás. Ami igazából nem is megoldás semmire mert ilyen alapon még több erős mag még jobb. 8 helyett 16 jobb, ahelyett a 32 és a 64 MÉG jobb.
    De a valóságban van olyan, hogy optimum ill. más paraméterek... és általában 10-ból 9.5 ember arra törekszik.

    Visszakanyarodva a fenti példára, ezért nem jár senki napi szinten Ferrarival... mert erős, de kicsi a csomagtartója.... meg traktorral se, mert annyi "csomag" meg nem kell és nehezen parkol.

    @opr:
    A Ryzenek pl. amivel nagyon sok teljesítményt nyernek: IF, magas frekik, nagy ramfreki az idle fogyasztást is jó 20-25W-tal megdobják. Az mivel hw-s megoldás nem lehet kikerülni de ettől közel sem optimális és számít.

    Nem 2 vs 10W hanem 25W (4650G) vs 45-55W (3600) nálam.
    Persze a legegyszerűbb úton kell spórolni először. Ha sok az idle=nincs szükség a gépre akkor minek menjen? Ez is lefelezi az átlagfogyasztást de itt jön be a többi paraméter ami szintén számít, főleg ha csak használni szeretné vki kényelmesen az eszközt.

    Régen elvoltunk 2 perces boot idővel is... ma már nem. A 10-15mp még belefér, de igazából (ultra)mobil OS-ekről megérkezve már ennyit se bírnak az emberek. Ha a fentit nézem: sokat eszik de kilövöm akkor valóban sokkal kényelmetlenebb 10mp is, mint a megnyomom a gombot és ott a felület.
    Intelnél úgy van connected standby is egy ideje amivel az utlramobil platformoknak ezt a részét próbálják utolérni. Ha kikapcsolod nem jön meg az üzenet sem pedig ez is elég alap elvárás manapság. Ahogy az is, hogy az ultramobilt ki sem kapcsolod. Előhúzod és máris tudod használni. Cserébe mégis 4 napig online ha nem használod.

    Ezek olyanok amiket egy átlaguser néz. És szerintem nincs is eltévedve ha ez számít neki.
    Megérkezik a mail és csipog. Miért ne jöhetne ez asztalra is, nemcsak a zsebbe? Előveszi és máris ott van. Valamit meg akar nézni, a telefonért, tabletért nyúl mert megy. Felveszi és ha nincs kikapcsolva akkor nincs lemerülve sem, mint az x86 notija...

    Ezek tök hétköznapi események és emellé az x86-os rendszerek olyan mintha a tárcsázós telefont kéne előkapni a hátizsákból.

    Szerintem szükséges irány, főleg most amikor nem 2-4 magokról beszélünk x86-on hanem 8-16-32-ről.
    Jó is az irány mert nem az agyatlan brute force megoldás. Hw-s oldalról nem is lehetséges sok esetben.
    Hogy mennyire egyszerű az más kérdés... nyilván nem az mert sw oldali támogatás kell. Ami pedig bonyolult és drága. Innen jön szerintem dokanin nézőpontja is.
    És ez igaz is. De meg kell lépni ha erre akarunk fejlődni. Ára az lesz. Ez van.

    [ Szerkesztve ]

  • sb

    veterán

    Ja és még egy tévképzet - szerintem.

    Azt írtam, hogy hw oldalról nem is megoldható minden.
    Sw oldaról viszont muszáj ezzel foglalkozni ha igazán optimális megoldást akarsz. Az téves, hogy ehhez sw oldalon nem kell hozzátenni, akár most is, heterogén rendszer nélkül.

    Ultramobilon, főleg droidon is sláger volt gyerekbetegségként évekig a battery drain. Azt csak os oldalról nem lehetett volna értelmezhető, kényelmes szinte hozni. Persze van hibernálás meg minden szar de attól os szintről kezelve ugyanúgy szarul működhet egy progi.

    Az ok meg egyszerű: az os nem tudja mit és miért csinál a futtatott user app. Lehet,hogy kilövi amikor nem kéne, leveszi a prioritást amikor pörögnie kéne. Önmagában a cpu terhelés sem ad semmi infót mert lehet, hogy azért eszi a cpu-t mert szar a program. Akkor vissza kéne fogni. De lehet, hogy azért pörög, hogy téged kiszolgáljon. Ezt honnan tudod os szinten?

    Épp ezért vannak x86 és a hw-s (pl. Ryzen) oldalon is anomáliák. Nem hatékony a kezelésük.
    Erről regényt írtam már más topicokban, hogy turbo, órajelkezelés, os szintű power eff. beállíás agresszívitásban milyen különbségek vannak.

    A kétmagos Athlon így tud pattogósabb lenni mint a 6-8 magos Ryzen. Így lehet egy TCMD megnyitásra is 2mp-t várni PCIe 4.0 SSD-vel is. Vagy így lehet utóbbi 4k random IOPS-át negyedelni.
    Vagy fordítva: 2-3 agresszívebb beállítással így lehet elérni, hogy a fent írt 45W helyett is 80-90W-ot elpöfög egy 3600 "idle"-ben. Értsd: 0.5-1% cpu terhelésen amikor csak a megnyitott cuccok állnak a desktopon de semmi nem történik. Ha meg egy szarul megírt progi feltolja 2%-ra akkor már ez sem tartható.
    Esetleg tolsz egy Cinebench egyszálas mérést és nem tud maxra Turbozni mert a cpu félreérti a terhelést. Allcore Turbo-n tartja magát a CB 99.9% single core és a maradék 0.1% többi magot érintő terhelése miatt. :D

    Ezt nem tudod hw/os oldalról optimálisan kezelni.

  • sb

    veterán

    válasz Puma K #31 üzenetére

    Aztán elindul egy progi ami más jellegű terhelést ad/szar és rádob még 10W-ot.
    Nálam a HD Sentinel pl. +5-10W 3600-on. A maradék tray-en futó 8-10 app semmi iylet nem csinál.

    Ill. nyilván az is eszik cpu-t, 2-3W-ot a 10 cucc biztos rátesz ahhoz képest ha egyik sem futna. De ez így normális.
    Ellenben a fentivel.

    [ Szerkesztve ]

  • sb

    veterán

    válasz opr #36 üzenetére

    Nálam a Park Contol nevü progi váltogat Win10 power sémák között. Nekem csak ez segített úgy, hogy idle/light load sem kell +10-40W-okat rápakolni de a gép sem megy vissza 2-3 generációt reakcióidőben.

    Ha power eff-re rakod a win10 sémát akkor értelmezhetetlenül belassul a gép, az órajelkezelése konzervatív lesz, core parking, magok kikapcsolása is sokat lassít, ez téma volt a Ryzen megjelenésekor. Az SSD-n a cpu lomhasága is lassít (Intelen is, egy konzervatívabb Speedstep ugyanúgy felezi, harmadolja a 4k IPOS-t) és a cpu-tól független PCIe energiatakarékosság is.

    Viszont ha ez mind fel van tolva, energiamenedzsment kilőve az meg valós idle (tényleg 0% körüli) terhelésen egyből +10-20W. Kis terhelésen (gyk egy megnyitott, leminimalizált FF ablak is) meg még több lehet.

  • sb

    veterán

    válasz dokanin #38 üzenetére

    De mi a csúcskategória? 64 mag? :) Oda valóban felesleges...

    Vagy már 6-8-12 mag mellé sem kell?
    Most 6-8 notikat tudsz venni 1000 EUR körül amik letolják teljesítményben az 5 évvel ezelőtti desktopot kb. 3x. Oda elkelne pl...

    De amúgy szerintem a teljes mainstreambe mehet. Ahol kell a kraft a legritkább esetben kell mindig. Max a renderfarmon meg a bányában van így. A többi helyre - átlagfelhasználóknak - meg ez a kombó a megfelelő.

    Fentebb próbáltam fejtegetni, hogy miért. Senkinek a gépe nem ketyeg 0/24-ben úgy, hogy közben 50W-ot bezabál idle. Az elég necces lenne.
    Ha viszont ketyeghetne mert az 50W-ból 5W lesz akkor miért ne? Onnantól online van mindig. Notira még inkább igaz. Most olyan határon belül használjuk amin belül kevésbé látszik szükségesnek de épp azért mert ezen belül vizsgálod.

    Notikon se lehetett anno érdemben játszani vagy normális, erős konfigot használni bármihez. Ma meg lehet. Innentől változnak a keretek is.

  • sb

    veterán

    válasz dokanin #43 üzenetére

    Diverzifikálni lehet de a probléma általános és elvi.
    - Ha lesz hetegorén felépítés akkor arra kell/érdemes optimalizálni sw oldalról mert bizonyos felhasználási sávokban (én úgy gondolom, hogy az átlaghasználat 99%-ában) és hasznos lesz és ez alapján választhat simán a user gépet.
    - Ha viszont ez megtörténik attól még lehet szegmens (szerintem szűk) ahova ezt nem érdemes elvinni, ebben igazad van. De ha már van akkor miért ne?

    Ez ott érdekes ahol nem ér semmit a fogyasztás optimalizálása az pedig szerintem csak az a réteg ahol konstans nagy terhelést adsz vagy nincs is igazán szükséged gépre (mert soha nincs terhelve). Tehát még önmagában a csúcskategória sem határozza meg.

    Utóbbira csak kis mag is elég lenne.
    Előbbinél meg mi marad? Renderfarm? Ahol nincs full terhelés, akár szerver oldalon ott is számít a fogyasztás, nagyon is. Sok gép, sok cpu, az üzemeltetési költség a nagyobb nem a beszerzési. Változó load mellett simán lehet optimálisabb jóval egy ilyen felépítés.

    Persze szerver oldalon általában feladatra terveznek, így nincs annyira eltérő feladat/terhelés. Ha van akkor eleve rohadt bonyolult a menedzsment, sw oldal. Tehát ott meg drága lehet. Drágább mint amit nyernek vele. De haszna ott is lenne elvben.

  • sb

    veterán

    válasz dokanin #67 üzenetére

    Ez user oldalról kell érkezzen.
    Nyilván ultramobil a jó példa és te nem ebben gondolkodsz. Írtam, hogy ott mekkora gáz volt a battery drain és mekkora divat lett a diagnosztikai program ami nézi mi mennyit eszik a háttérben. Innentől pedig a userek szavaztak a pénztárcájukkal. A naptár progi meg időjárás widget ami megette az akksidat ment a kukába.

    De desktopban gondolkodsz és csakis high perf alkalmazásokban, de ez szerintem férlevisz.
    Egyrészt a "desktop" teljesítmény lejött már rég mobil vonalra. Én is most gondolkodom el, hogy miért van 2700/3600/4650G-m ha alig használom néha az erejét egy kis vidókódolásra. Más játszik de arra is elég bőven jelenleg mind. És ez pár éve nem ment bele egy noti házba de ma bedobsz egy 5600/5800-at és ha nem is 15W, de 28-35-45W-ból 90%-ban ugyanazt hozza.
    Átlagra nézve meg talán 99%.
    De ehhez az kell, hogy ne a full kraftra és 7/24 100%-os terhelésre optimalizálva gondolkodjuk amiből te kiindulsz.

    Egyébként az ultramobil is fejlődött az meg lassan a régi noti szint. Erre haladunk és ha ez működik mindenki a telefont kapja elő, notit visz ha mindenre jó. Később esetleg már csak telefont és dokkol.

    Sw oldalról pedig szintén más az átlagelvárás. Már írtam korábban, nem fejtem ki bővebben de az, hogy kell néha kraft és 8-16 magot is meg tudok hajtani attól még 99%-ban a többi határozza meg a mindennapi munkát: online gép, bejövő üzenetek, háttérben futó appok, widgetek, levelezés, stb... Ha ezt mind ráereszted akkor terhelésed is lesz. Feleslegesen, nagy magokon.
    Nem véletlen, hogy az x86(+Win) közel sem ez a felhasználás még ma se és nem is nagyon menne rajta. Ebben az ultramobil sokkal előrébb tart.
    Ha sw oldalról sikerül felnőni és ehhez jön a hw oldali támogatás akkor lehet egyáltalán cél, hogy ebbe az irányba lépjen el a fejlesztés. Akkor meg ezzel tudsz érdemi sw-t írni, nem a régi rendszer szerint: power gomb, boot, hatalmas os betöltődik és még mindent külön elindítasz, bezársz.

  • sb

    veterán

    válasz tasiadam #68 üzenetére

    Már ezt is sokszor írtam de az órajelállítás, küszöbértékek, core parking, stb... sokkal többet számítanak. Meg az IF/cache/ram OC.
    Ezek idle is 10-20W-ot rádobnak, a magok meg még egy kicsit a fentiek miatt de nem a core power a problémás alapvetően.

    Amúgy az Intel IF nélkül és monolit felépítéssel sokkal jobban viseli a light load-ot kisebb fogyasztással még mindig. Szóval nem feltétlen ez lehet a kis magok bevetésének oka. Hacsak nem vmi nagyon sokkal alacsonyabb szintre akarják belőni az idle-t.

    Max load-on meg nyilván jobb lenne a több nagy mag. De perf/W már nem feltétlen.
    Említve volt a Skylake IPC ami lehet, hogy egál a Zen1-el de a perf/W kb. 2x jobb utóbbin még így is az alacsonyabb órajeleken ahova ezeket szánják.

    Szóval lehet, hogy az Intelnél vmi kényszermegoldás tényleg az egész. De értelme akkor lenne ha tényleg light load/idle-ben adnának pluszt a kis magok megfelelő sw körítéssel, ezzel hozzájárulva a valós fogyasztási előnyhöz vagy folyamatos online üzemhez.

  • sb

    veterán

    válasz dokanin #92 üzenetére

    Te még mindig olyan paradigmákból indulsz ki amiről nem lesz szó a fejlesztési irányokban.
    Sőt már ma sincs nagyon sokszor.

    Nem tudom milyen kódot írsz, de ha render/szimuláció/bányász sw akkor értem. Minden más esetben nem ez a preferencia szerintem amit írsz.
    Nem nagy teljesítménye hangolt algoritmust kódolnak 100%-os terhelésre hw-gyenge környezetbe.

    Nézz szét most mennyi sw, de főleg mennyi folyamat fut egy x86-on a háttérben. Ezek a hétköznapi feladatok. Ezek egyike sem arról szól, hogy 4-8-16 magot fullra terhel és órákig várjuk a futás eredményét. Arról szól az sw-k 99%-a, hogy fut a háttérben és valamit pötyög.
    Ettől még lehet önmagában teljesítménycentrikus, lehet, hogy amire kell ott gpu-t használ, vagy mostanság akár vmi neurális hálót, akár hw gyorsítással. De akkor sem konstans 100% terhelést ad hosszú ideig.

    Innentől ma sem él az szvsz amit írsz, hogy egy programnak csak az a feladata, hogy "lefusson" a lehető leggyorsabban mert nincs elég erőforrás és legszívesebben 2-4x annyi hw-t tennél alá.

    És erre tesz rá még 1-2 lapáttal a mobil-ultramobil ág, ahol:
    1. Hatványozottan számít az akksi miatt a felhasznált energia minimalizálása.
    2. A rendszer/os is sokkal inkább el van tolódva a párhuzamosan futó sok folyamat felé még az x86-hoz képest is.
    És itt is efelé megyünk úgy, hogy már ma sem az "egy algoritmus fut a gépen aminek várjuk pár nap múlva az eredményét, a köv. prímszámot".

    És még egy megközelítés a fenti mellé: mi van a grafikával és a dedikált hw-ivel? A cpu/sw rendert 2 évtizede elhagytuk pedig ott is ugyanez volt, x86 kód kuka és teljesen újat kellett írni kényelmetlenül.
    Mi van a többi, hasonló spec ággal? Van DXVA és egyéb video encode gyorsítás gpu-n vagy fixfunkcióson. Gyk. ma se nagyon lenne filmnézés ezek nélkül. Van egyéb gpu hw gyorsítás akár böngészőben. De nagyobb rendszerben gondolkodva most Apple M1-en is "megérte" külön gyorsítani ezt-azt. Lassan jönnek az új slágerhez is a hw-s gyorsítók a neurális hálókhoz.
    A te gondolatmeneteddel itt is lehetett volna bármelyikre azt mondani, hogy 10-50x Gflops kéne az akkori cpu-khoz képest, tessék a 10-100x annyi magot/hw-t prezentálni kedves gyártók. Most annyi változott, hogy nem a hw kevés hanem több a lehetőség és van tér lefelé menni sw-ben egyéb előnyök (akku, mobilitás, méret, hűtés, always online, multitasking működés) miatt.

    [ Szerkesztve ]

  • sb

    veterán

    válasz dokanin #112 üzenetére

    Ezzel egyetértek de nem hiszem, hogy ez jellemző.
    Számításigényes feladatokra kellhet ennyi extra és erős mag. Mi az ami UX folyamat/esemény része (gyk. nem számítás/szimuláció) és nem kéne elfutnia 1db magon ami önmagában mips/gflops szinten irdatlan teljesítményre képes?*

    Ill. ha erre is van szükség, akkor sem nagyon lehet a másik oldalát figyelmen kívül hagyni. A maradék időben jó lenne egy energiahatékony architektúra ami a 0.1s burst-ökön kívül az erre fenntartott 16-32 magjával idle-ben is tud valami kezdeni a fogyasztással. :)

    És végül visszakanyarodva a fő érvhez: még mindig onnan indulok ki, hogy sokkal inkább van szükség háttérben futó folyamatokra mint 1-2 éppen UX-en aktív dologra (ennél többet nem nyomkod senki mert a szeme/keze lesz a limit). A háttérben viszont még mindig több 100 folyamat futhat, de ami user szempontból felfogható abból is 10-es nagyságrend.

    *Kivéve a saját korábbi példámat hozva: Ha a chatprogramban az épp bepötyögött emojikat is neurális háló animálja majd 1.5TFlops számítási kapacitással. :D De ennek meg olyna ára van, hogy csak akkor jutunk el ide, ha "ingyen" lesz a mai 1.5TFlops árához képest:
    1. A hw aminek ennyi szabad kapacitása van ilyen f*szságokra.
    2. A fogyasztás, mert ezzel együtt is 2 hétig elmegy töltés nélkül. :D
    3. És a fejlesztő (team) bérét is elbírja akik 2 hónapig kódolják a gfx-et és 3 hónapig trainingelik a hálót. :D És ennek mind visszajön az ára a kedves chatelő userektől. :DDD

    Ide asszem akkor jutunk el, ha az Mi írja a kódot és tervezi a chipet is.

Új hozzászólás Aktív témák