Új hozzászólás Aktív témák
-
hugo chávez
aktív tag
Knights Ferry-Fermi összehasonlítás: Compilers and More: Knights Ferry Versus Fermi
-
#95904256
törölt tag
Ha valaki linkelne Knights Ferry eredményeket, azt megköszönném.
Az előbb egy ilyet találtam: High Performance and Scalable GPU Radix Sorting
quad core i7 -> 240M 32-bit key/s
Knights Ferry -> 560M 32-bit key/s
GTX480 -> 1005M 32-bit key/s -
cwn
tag
sli-be megy a cucc?, mert ha beteszek 8 fermit egy alaplapra leszedi az egrol a csillagokat
-
Yany
addikt
"A 22 nm-es gyártástechnológiát használó MIC architektúra több mint 50 processzormagot alkalmaz, ami elméletben borzalmas nyers erőt jelent."
Vagyis borzalmasan fog teljesíteni?
-
LordX
veterán
válasz
#95904256 #23 üzenetére
Nem a kód hatékonyabb, hanem az erőforrások kihasználása. Egy CPU az általános célú, mindenre van egy-egy végrehajtó egysége (vagy több mikroutasításra bontják, és több lépésben oldják meg), sőt, legacy cuccokat is kell támogatni valamivel, ami kb. soha nem fog csinálni semmit, de a "papíron FLOPS"-ba beleszámít.. Ha épp egy speciális feladatot hajtasz végre, akkor a többi részegység nem csinál semmit. Egy szuperskalár processzorban nagyon nem triviális (konkrétan NP teljes) az, hogy milyen sorrendben kell az utasításokat kiadni, hogy várható értékben minél nagyobb legyen a részegységek kihasználása, a legdurvább fordítók sem végeznek tökéletes munkát, sokszor kihagynak olyan lehetőségeket, amit egy járatos ASM programozó azonnal meglát.
Egy GPU egy végrehajtóegysége ellenben olyan mint egy faék, pl. az Evergreen családban egy processzorban 5 ALU van, sőt az nVidia G200 processzora skalár, azaz EGY darab ALU. Előbbinél a kihasználtság csak annak a kérdése, hogy hány darab független utasításod van egyszerre, utóbbinál meg mindig 100%, csak tudd elég adattal etetni.
Mátrixszorzó algoritmus (és eddigi tapasztalataim alapján jóóóó sok mátrixszorzást végeznek "tudományos célra") van CUDÁra ami a GPU teljesítményének 95%-án működik, CPU-n nem láttam még olyat, ami a elméleti teljesítmény felét tudná (én ne dobná magát hanyatt, ha a mátrix nagyobb, mint a L2 cache). Ellenben egy feltételes ugrásokkal teletűzdelt kód kb. rémálom egy GPU-nak, addig egy CPU >80% pontossággal bebecsüli melyik úton kell továbbhaladni és már akkor elkezdi végrehajtani, amikor még ki se derült az eredmény.
TL: DR: Az x86 másra való.
Értem én az Intel marketingjét, hogy mivel megy rajta x86, az eddigi kód futtatható (max újra kell fordítani, hogy legyen AVX is a kódban, lásd a mellékelt fordítót), de hogy a régi x86 kód nem fog gyökeres módosítások nélkül 32 vagy 640 vagy akármennyi ami több mint 2 szálon futni, az hót ziher. Akkor meg már tök mindegy, hogy x86, vagy nem.
-
isti84
csendes tag
válasz
#95904256 #23 üzenetére
Sajna régen tanultam ezekről, de valamicske tudás maradt. Jelen esetben az inorder, amit a cikk is emleget egy baromi rossz ötlet. Ilyen arhitektúrára baromi nehéz jó fordítót írni. LordX elmondta miért nem életképes egy x86-os mag grafikus megjelnítésre. Egy példát én is adhatok. Ráncosabb homlokú kollegák emlékezhetnek a Delta Foce c. FPS-re. Az egy 3D gyorsítást mellőző program volt, az akkori x86-os arhitektúrák nagy részét egyszerűen berohasztotta. Tudom nem a legjobb példa, de talán innen is látszik kicsit a CPU-GPU képességeinek különbsége.
Másrészről, a FERMI egy marha jó tehnológia, de nem ezért a felárért. Irtózatos nyers ereje van általános számításokra. De sajna már látsznak a jelek a chip butítására, mint pl.: GF108.
S ha már csak a feldolgozó szálak számával számolunk. Látom keresel AMD X6-ost. Az a CPU 6 feldolgozószálon képes műveletet végrehajtani, a most fellelhető nem profi és nem alkalmazás célú szoftverek, azaz a játékok, nem képesek kihasználni. Vegyünk egy AMD GPU-t, csak a márka kedvéért, egy 4670 es kártyánál (csak tippelek bocsi) van 32 feldolgozószál. Ha mondjuk egy nyers videófájlt kell átdolgozni akkor a 32 feldolgozószállal dolgozó GPU-ra írt kódolók gyorsak és hatékonyak is. Ellenben a 6 szállal dolgozó CPU-nál.
De mint írtam a hsz. elején sajna régen tanultam ezeket. Kéretik szólni ha valamit rosszul írtam.
István
-
hakosh
tag
Amikor megláttam azt az Intel VGA-t, akkor olyan érzés fogott el, amilyet még ember is ritkán vált ki belőlem. Olyan furcsa és ijesztő is egy kicsit, de mégis kíváncsi vagyok rá, hogy mi az
-
MittuDomain_
őstag
Klasszikus Abu-cikk, ha a felét értem sokat mondok...
(Persze a szöveg része tiszta, csak a számok kevésbé, no offense)és ez a fórum hozzászólásokra is igaz, tanulnom kell még, na
-
#95904256
törölt tag
válasz
TESCO-Zsömle #24 üzenetére
Hogy ez miért is nem jó példa:
- a HW-tesszelálás nagyságrendekkel több erőforrást használ
- emulációnál rengeteg adatmozgatásról is gondoskodnia kell a kódnak -
Abu85
HÁZIGAZDA
Az is problémát jelenthet, hogy GPU-kra inkább feladat-párhuzamosan programoznak. A Larrabee koncepciója inkább az adatpárhuzamosságra épül. 30+ magnál annyi szál van, hogy a CPU-nál alkalmazott programozási módszerekkel baromira nehéz felügyelni a chipben zajló folyamatokat. Ezért is alkalmaznak a fejlesztők a GPU programozására más módszereket.
-
LordX
veterán
válasz
#95904256 #18 üzenetére
Nem, nem igaz, kifejtettem.
Az x86 utasításkészlet alapvetően egy skalár utasításkészlet, ami kapott pár vektor-kiegészítést (SSEx). Az 1980-as években tervezték. Skalár problémák megoldására. És foltozgatták, hogy aktuálisabb problémákra többé-kevésbé használható legyen. Soha, de soha nem lesz olyan hatékony vektorműveletekre, mint egy effektíve erre tervezett utasításkészlettel rendelkező processzor (pl. egy GPU). Kis körültekintéssel egy GPU elméleti számítási teljesítményének 70-80%-át könnyedén ki lehet használni - egy HT-s P4 esetében ez a szám nem nagyobb mint 30%, ha hülyére optimalizálod a kódot, de azóta fejlődött a tudomány, legyen 40. Még mindig 2x akkora TFLOPS-ot kell papíron kitolnia magából, hogy ugyanott legyen egy nem-benchmark programban, mint egy Fermi. De mivel inorder, kötve hiszem, hogy hozza ezt a szintet.
De ne legyen igazam.
-
vanhalen
senior tag
Véletlen automatikusan "hulladék generációt" olvastam
-
menalcas
őstag
Szerintem ez sem lesz befejezve
-
Móci
addikt
Ez akkor a 'villantunk egyet az x86-os procikból összetákolt cuccunkkal' rovat?
Ha az intelen múlna, akkor mindenben x86-os processzor lenne. -
"mely az előzeteseknek megfelelően nem jelenik meg kereskedelmi forgalomban"
Akkor nem értem a felhajtást... egyébként elsőre elméletben meggyőző, de tényleg ki kellene próbálni - lásd Fermi, Larrabe. De maga a MIC elgondolás tetszik.
-
alul a képen Knights Ferry van, a címben meg Fierry. valamelyik nem jó.
-
LackoMester
addikt
Jól hangzik
, de majd meglátjuk mire lesz képes....az árára inkább gondolni sem merek...
-
buzus
aktív tag
Akkor ez most pöpec cucc?
-
LordX
veterán
32 darab in-order x86 mag? Ez valami vicc? Hatalmas pofára esés lesz ebből az egészből.
"A rendszer 16 utas, 512 bites vektoros egység úgymond etetésére vállalkozott, miközben a 8 MB-os gyorsítótár nincs bankokra osztva." Ezt nem lehet átfogalmazni? Ötszöri újraolvasásra sem vagy teljesen biztos benne, hogy azt értem, amit akartatok írni. (Milyen rendszer, a 32 x86 mag? Mi 16 utas, a rendszer vagy a vektoros egység? A gyorsítótár az kié?)
-
FRENK1988
veterán
Ezen hogy menne a krájzisz?
-
9950es
aktív tag
A 22nm-es variáns felfogható egy next gen konzolnak cakkompakk?
Új hozzászólás Aktív témák
- Hajmeresztő ajánlat: 34,5 milliárd dollárért vinnék a Google Chrome böngészőjét
- Konteó topic
- Óra topik
- Medence topik
- Kertészet, mezőgazdaság topik
- Xbox tulajok OFF topicja
- Linux kezdőknek
- Autós topik látogatók beszélgetős, offolós topikja
- Bluetooth hangszórók
- Kiválthatja az AI az egeret és a billentyűzetet?
- További aktív témák...
- Apple iPhone 13 Pro Max 128GB, Kártyafüggetlen, 1 Év Garanciával
- ÁRGARANCIA!Épített KomPhone i9 14900KF 64GB RAM RTX 5080 16GB GAMER PC termékbeszámítással
- ÁRGARANCIA!Épített KomPhone i7 14700KF 32/64GB RAM RTX 5090 32GB GAMER PC termékbeszámítással
- LG 65" C1 OLED - 4K 120Hz 1ms - NVIDIA G-Sync - FreeSync Premium - HDMI 2.1 - PS5 és Xbox Ready!
- Telefon felváráslás!! Xiaomi Redmi Note 11, Xiaomi Redmi Note 11 Pro, Xiaomi 11 Lite
Állásajánlatok
Cég: FOTC
Város: Budapest