Keresés

Új hozzászólás Aktív témák

  • Abu85

    HÁZIGAZDA

    válasz ShiTmano #6 üzenetére

    A Genoa gyorsabb lesz a Grace-nél, már a Milan-(X) is az. De a Genoának 2-way kiépítésben 192 magja van. Viszont ahova a Grace elvileg megy, oda az AMD a Bergamót szánja jövő év elején. Az 2-way kiépítésben 256 magot használ, ami bőven több a 144-nál. De az egy NV-s rendezvény volt, nem fogják azt mondani, hogy nem lesz versenyképes, amikor megjelenik, inkább keresnek egy három évvel korában megjelent processzort és mutatnak rá egy összevetést.

    Egyébként a Grace piaca az lesz, hogy a H100 mellé megvegyék, és azzal skálázzák. Igazából tök lényegtelen, hogy bőven le tudja verni egy mainstream szerverproci, mert mainstreambe már csak azért nem fog kelleni, mert ARM. Látunk ma is erős ARM dizájnokat, de egyik se sikeres a kasszánál, mert "jaj újra kell írni a programokat".

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz GreatL #3 üzenetére

    Persze. Kis kocsihoz rögzített, könnyen magunk után húzható kompresszort is adnak hozzá. :DDD

    #9 b. : Szóval sem mondtam, hogy nem jó. Igazából az NV-nek méregetni is mindegy, mert ahol nem versenyképes a Grace, ott már eleve az távol tartja a vevőket, hogy ARM. Tehát igazából tök mindegy, hogy ahol az ARM probléma, ott nem versenyképes.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz b. #12 üzenetére

    Azért ez nem ilyen egyszerű. Ha megnézed a nagy rendeléseket, akkor nem az AMD-t és az Intelt cserélik IBM-re/ARM-ra, hogy igazodjanak az NV-hez, hanem az NV-t cserélik Intelre és AMD-re, hogy ne kelljen újraírni a programokat az új ISA-t használó host CPU-ra.

    Világosan látszik, hogy ha választani kell, akkor inkább a CUDA kódokat fordítják át HIP-re vagy DPC++-ra, attól függően, hogy milyen gyorsítóra ugranak NV-ről. Ennek az oka, hogy ezeket sokkal-sokkal-sokkal egyszerűbb portolni, mint ARM vagy Power ISA-ra optimalizálni már megírt x86/AMD64 kódokat. Utóbbi lényegesen drágább. Annyival, hogy inkább megéri drágább hardvert venni, mint portolásra költeni egy rakás pénzt.

    Ez azoknak éri meg, akik valami nagyon-nagyon specifikusat csinálnak, és ott már hasznosabb a szoftver átírásába ölni a pénzt.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz b. #16 üzenetére

    Nagyon fontos lenne tudni, hogy az NV mit ért "versenytárs CPU-kon". Mert a Grace puszta paraméterezése elképesztően messze van a Genoa/Bergamo paraméterezése mögött, ami egyébként mellette lesz elérhető. Már ott jelentős a különbség, hogy a Grace 0,5 TB memóriát ad per CPU, míg a Genoa/Bergamo esetében ez 12 TB. Az esetleg elképzelhető, hogy az Intel Sapphire Rapids-ra gondoltak, ami ugye 56 mag per tokozás, tehát összesen 102 mag két CPU viszonylatában, de ehhez is jóval több memória társítható (8 TB perc CPU), mint 0,5 TB per CPU. Ezért lenne lényeges adat, hogy mire gondolt a költő, mert az x86/AMD64-es fejlesztések más ligának tűnnek.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz b. #18 üzenetére

    Az FTC kimondta már korábban, hogy az x86/AMD64 emulálható. Azt nem tekintik törvénytelennek. Ami itt probléma lehet, hogy az NV és az Intel 2011-ben megegyezett egymással, amiben ugye fizetett az Intel 1,5 milliárd dollárt a stiklikért az NV-nek. Ennek az egyezménynek a része volt, hogy az Intel Architecture Emulatort az Intel a saját tulajdonának tekinti, tehát az x86-ot biztos nem tudja emulálni az NVIDIA, mert azt tiltja egy korábban megkötött szerződés. Az AMD64 talán emulálható, erről nem tudom, hogy van-e külön megállapodás az AMD-vel.

    Licencelni magát az ISA-t nehezebb ügy. Az Intel biztosan elzárkózik az x86-tal. Az AMD szerintem úgy van az AMD64-gyel, hogy van az a pénz, de nagyon durván megkérnék az árát.

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz b. #21 üzenetére

    Nem hát. Egy csomó piac már csak azért is nehezen támadható számukra, mert ARM.

    #22 Albus_D : Milan beszerezhető. A megosztott adatok alapján gyorsabb is. Nyilván okkal nem a Milan platformhoz mérték.

    Nézd az USA eddigi három Exascale megrendelését. Nem az AMD-t és az Intelt dobták, hogy az NV GPU-nak kedvezzenek, hanem az NV-t dobták, mert sokkal egyszerűbb a CUDA kódot HIP-re és DPC++-ra átírni.

    A Grace 72-magos. Két Grace-ben van 144 mag.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz Albus_D #25 üzenetére

    És ezt azért nem végezték el ők, mert?

    Bárki megnézheti az USA három Exascale megrendelését. Továbbra is Intel és AMD konfigurációkat építenek. Ezzel teljesítik a CORAL-2 követelményeket is. ;)

    #26 b. : Az NVIDIA DGX A100-at Milan platformmal is szállítja, hiszen elég csak a BIOS-t frissíteni hozzá. Még Milan-X-szel is tudják szállítani, mert hétfőn jelezték is közleményben, hogy már így is rendelhető.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz b. #28 üzenetére

    Nekem mindegy. Olyan régi CPU-hoz hasonlítják a saját új generációs cuccukat, amilyenhez akarják. Eleve az adat, amit közöltek egy várakozás, tehát a saját eredményüket nem mérték.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz b. #30 üzenetére

    [link] - Itt már láthatsz Milan-Grace összevetést a kérdésben. De felőlem elhiheted, hogy a világ egyik vezető vállalata, az NVIDIA csak nem tudott szerezni Milan platformot összehasonlításra, így inkább a Rome-ot választották, és biztosan nem az játszott közre, hogy a Milan platformot pont nem verik a Genoa és Bergamo platformokkal párhuzamosan piacra kerülő CPU-val. :)

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz b. #33 üzenetére

    Mivel a SPEC Integer teszt van már egy rakás Milan platformmal is, így kinézhető az adatbázisból, hogy a Milan nagy falat a megadott Grace eredménynek. Ugye az EPYC 7003-as sorozatú csúcsmodell 2-way konfigurációban 860 körüli eredményt ad. Ez nem százalékos becslés, hanem konkrét mérés. És ez az eredmény nagyobb az NV által közölt 740-nél, amit két Grace-re valószínűsítenek.

    A SPEC Integer teszt egy CPU-s teszt. Le se fut GPU-n.

    Ha a leglassabb DGX A100 szervereihez mérik, akkor ez igaz, csak vannak gyorsabb DGX A100 konfigurációik is, mert kérheted ezt a rendszert Milan platformmal, sőt, hétfő óta Milan-X-szel is, amihez viszonyítva már nem igaz az állításuk. Ezért lenne nagyon fontos konkrétan fogalmazni, mert így nem tudni, hogy mire gondolt a költő, és látványosan nem jön ki a matek, ha nem három éves, meglehetősen idős CPU-hoz méred az adatokat.

    #34 morgyi : Nem ez a baj, hanem az, hogy a host CPU-n futó kódok binárisak. Egyszerűen, ha valaki 10 évig optimalizált egy kódot x86/AMD64-re, akkor onnan sokkal drágább ARM-ra átállni, mint a CUDA kódot átvinni HIP-re vagy DPC++-ra. Utóbbi úgy 99,9%-ban megoldható automatizáltan, tehát nem igényel emberi beavatkozás, és a teljesítményt is portolhatod így. Ezzel szemben egy ARM-ra való átállás jelentős emberi beavatkozást igényel, ha a kód teljesítményét is portolni akarod. Akkor meg már inkább úgy van vele a megrendelők egy része, hogy a GPU megy, és nem az ARM jön. A szoftveres átállási költségek így több nagyságrenddel kisebbek lesznek, és a piac ezt még mindig figyelembe veszi, sőt, inkább fizet a drágább hardverért, hogy a szoftveren tudjanak spórolni. Ha ez nem lenne így, akkor az ARM már rég elérte volna a 25%-os piaci részesedést, amiről még álmodoztak 5 éve, aztán szembejött a valóság, és az 1% is alig jön össze. Egyszerűen nehezen meggyőzhető a piac arról, hogy az ARM jó lesz nekik. Nem azért, mert rossznak tartják magát az ISA-t, hanem azért, mert utánaszámolnak, hogy ennek a szoftveres költségei mekkorák, és jelenleg még mindig sokkal olcsóbb lenyelni a drágább x86/AMD64-es platformok költségeit.

    Az ARM-nak a nagy előnye a TCO lenne, és arra érdemes is ráfeküdni, és ez az Intel ellen nagyon is működne, ha nem lenne egy hasonló TCO-t produkáló EPYC, amire még mindig könnyebb ugrani, mint ARM-ra. Ebből a szempontból nem lehet azt mondani, hogy az ARM rosszul számolt, mert az Intelhez viszonyítva tényleg komoly a TCO-ban az előny, de nem gondoltak arra, hogy az AMD a semmiből előránt x86/AMD64-en kb. olyan hatékony magokat, amiket az ARM használ. De még ez is működne, ha gyorsabban innoválna az ARM, de a nagy újítások is pont az AMD-től jönnek, lásd 3D tokozott cache. Így már nehézzé vált az ARM térnyerése, mert nem kínál annyi előnyt az EPYC-hez viszonyítva, hogy a potenciális vásárló a nyakába vegye a váltással járó jelentős szoftveres költségeket.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz Albus_D #36 üzenetére

    Ez attól függ, hogy az NVIDIA mit akar az ARM-mal elérni. A szuperszámítógépek élpiacán például van esélyük, mert az olyan speciális terület, ahol realitás az ISA cseréje is. Nem véletlen, hogy többféle ISA-val is be lehet kerülni a top500-ba. Plusz az NV-nek az is segít itt, hogy az Intel egyelőre nem üldözi ezt a szegmenst.

    A szerverpiac magját adó megrendelőknél, kvázi a mainstream vonalon már nincs sok esélyük az ARM-mal, mert más is tervezett már ide ARM-os CPU-kat, nagyon gyorsakat is, de nem értek el velük semmit. Ott van példának a Marvell-féle ThunderX3, ami az adatközpontok területén nagyon erős technikailag. Sok tekintetben túlteljesíti az EPYC-et, de gyakorlatilag azzal szembesült a cég, hogy a piacon termék eladhatatlan, mert ARM. Hiába a komoly technikai tudás, hiába a sebesség, hiába a jó skálázhatóság, ez semmit sem ér, amikor kimondod, hogy az ISA ARM, sőt, egyediek a magok, és el kell kezdened a programokat átírni hozzá. El is vitte a Marvell az ARM vonalat egyedi tervezés irányába, mert hiába terveznek eladhatatlan lapkákat, akkor inkább egyedi megrendelések teljesítésére költik az erőforrásaikat.

    Igazából az NV-nek azért kellett volna az ARM, hogy saját maguknak tervezhessék a magokat és az egész dizájnt. Ez furcsának hangzik, mert így is tudnak sajátot tervezni, de az ARM-ra portolt programokat az ARM saját szervermagjaira és saját dizájnjára optimalizálják. Ha tervezel egy külön magot ide, akkor rögtön szembesülsz azzal a problémával, hogy nincs rá optimalizált alkalmazás. Tehát vagy lemásolod az ARM dizájnját az adott területre, amit mindenki le tud, vagy felerősíted, és akkor meg optimalizált alkalmazásod nem lesz, amit futtathatsz rajta.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

Új hozzászólás Aktív témák