Új hozzászólás Aktív témák
-
Abu85
HÁZIGAZDA
Mert az ARM SVE a GPGPU-tól lop ötleteket, és nem olyan hígfos, mint az AVX-512. Konkrétan skálázható a rendszer, így ugyanarra az ISA-ra építhetsz olyan magot, amiben 128 bites SIMD van, és olyat, amiben 2048 bites. Eközben pöcre ugyanazt a kódot eszik meg, sőt, közel lineárisan skálázódó teljesítményt adnak vele. Az AVX-512 nem ilyen rugalmas, így azt baszhatja az Intel.
[ Szerkesztve ]
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
Abu85
HÁZIGAZDA
Nagyon nem futnak rajta optimálisan a vektorok, ha nem a célzott szélességű hardver van a magban. Rengeteg kézi finomhangolás kellene, amit kb. senki sem akar megcsinálni.
Az SVE abból a szempontból van fényévekkel az AVX előtt, hogy nincs is definiálva a vektormotor hossza. A programozó nem is tudja ezt, és nem is dolgozhat egy bizonyos hosszra. Tehát a hardver oldalán mindegy, hogy 128 bites vagy 2048 bites a vektormotor hossza, mindenféle alacsony szintű finomhangolás nélkül lineárisan skálázódik ugyanannak a kódnak a teljesítménye az egyre szélesedő vektormotorral. Az AVX erre megközelítőleg sem képes. Ilyen formában tök hasztalan vagdalni.
Az alapvető probléma az, hogy az AVX koncepció szintjén nagyon durván el van baszva az alapoknál. Ha valami skálázhatót akarunk, akkor az AVX-et úgy ahogy van ki kell dobni a kukába.
Volt egyébként az x86/AMD64-es magoknál erre megoldás az XOP-vel. Az alapjaiban egy nagyon átgondolt, skálázhatóságra tervezett rendszer volt, csak senki sem támogatta. Most nyilván már erősen visszasírja az ipar, látva azt, hogy az AVX-512-vel nem lehet mit kezdeni.
[ Szerkesztve ]
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.