Új hozzászólás Aktív témák
-
-
Duddi
aktív tag
válasz
Carlos Padre #52 üzenetére
+1
-
Duddi
aktív tag
Ebben a kiemelendő a "using combined floating point and integer" rész mivel a zen 2 megduplázták a floating point számításhoz kellő sávszélt vagy mit. Ebből jön hogy az a 29% floating point számításban gazdag műveleteknél fog kitűnni normál integernél jó ha lesz 12% Ami még mindig több mint a 3-5%
de ahogy mondod meglátjuk amikor kijön és AMD-n kívül más is tesztelheti.
-
wwenigma
Jómunkásember
[link] Érdekes lábjegyzet...
Processor enhancements including up to 64 “Zen 2” cores, increased instructions-per-cycle1
1Estimated increase in instructions per cycle (IPC) is based on AMD internal testing for “Zen 2” across microbenchmarks, measured at 4.53 IPC for DKERN +RSA compared to prior “Zen 1” generation CPU (measured at 3.5 IPC for DKERN + RSA) using combined floating point and integer benchmarks.
3,5 -> 4,53 az +29% a EPYC (Zen1 1xxx) vs EPYC2 (Zen2 3xxx ?) között. No majd meglássuk.
-
Amit leírtál az a késleltetés az új felépítésnél máshová fog kerülni. A chiplet és az IO vezérlő között ugyanúgy ott lesz egy késleltetés. Az L4 viszonylag lassú lesz az L1-L3-hoz képest és ha egy szálat az ütemező átrak az egyik chipletről a másikra, akkor az ugyanúgy érezhető lesz. A kérdés, amire a válasz még nem ismert, hogy a chiplet és az IO rész között mekkora lesz a késleltetés/sávszélesség és ennek a hatása mekkora lesz.
Az FX alapötlete jó volt. Aztán három pont hibázott. Először is a kis piaci részesedés mellett nem tudom miért hitték, hogy a fejlesztőket a masszívabb párhuzamosításra rá tudják venni. A második hiba az volt, hogy a egy szálon vészesen lassúra sikeredett, mert a mag lassú volt. Ráadásul sok szálon sem tudta rendesen kifutni magát, mert a modulon belül a frontend rész annyira szűk keresztmetszet volt. Ha egy modulon 1 mag teljesítményét 100%-nak vesszük, akkor két maggal nem tudtak a programok 170% fölé menni, sőt inkább alatta maradtak.
A Zen jól sikerült, ismét verseny van. De előre kell lépniük mielőtt az Intel magához tér. Erre van szerintem 18-24 hónapja az AMD-nek. Sajnos az első EPYC-nél azt láttam, hogy papíron bejelentették, de a nagy gyártóktól kb. egy évig nem lehetett venni gépet. A Dell-es kapcsolattartóm draftokat tudott csak adni kb. fél év után, a HP-sek pedig 9 hónap után voltak képesek szerezni egy teszt szervert kölcsönbe, de még nem tudták volna szállítani, ha rendeltem volna. Ezt kellene levinni előzetes BIOS/firmware validációkkal 3 hónapra. Szóval felőlem lehet 200% a backend, meg 2TB integrált NVMe, ha nem tudnak mennyiségben szállítani időben és nem tudnak felmutatni olyan előnyt (pl. +15% teljesítmény/ár) amiért érdemes váltani.
-
Kimutatható zen1nél is a ccx-en kívüli művelet, persze.. de közel se "fájt" annyira mint amikor másik chipen keresztüli memóriavezérlőn vagy azon tárolt L3ból kér át adatot a cpu... az "rug" egy nagyot a latencybe...
itt "előny", hogy mindenki "egyforma" így optimalizálni is könnyebb rá, és a kiszámíthatóbb késleltetésre is könnyebb tervezni cpu egységeken belül is (kevesebb adat "parkoltatási idő", hatékonyabb cache kihasználás).. az L4 is segíthet (ha tényleg lesz).Az FX egy érdekes koncepcióra épült .. én akkor kételkedtem (szomorúan) kicsit amikor az elvek egyre jobban szivárogtak ki róla... és végül tényleg "vegyes" lett a képe.. ugyan FX cpu-m van, mert amikor megjelent akkor is AM2+ platformom volt már, és folyamatosan "fejlesztettem", kis lépésekkel és pár éve FX van. Ár értékben nekem megérte...
De a zen más, a koncepció alapból teljesen más elvre épül ami "jól is sikerülhet".. a kulcs baja a kapcsolatok közötti késleltetés lehet (és jelen is van ez a design gyengeség)..
Csak még is.. ezen "hiba" ellenére is lehet győztes, mert más tulajdonságok ellensúlyozhatják a gyengeségét... Pl. a Zen backendje az intel jelenlegi architektúrájához képest vagy 1/3maddal több feldolgozót tartalmaz, de a frontend kb. hasonló erősségű, így a backend ereje nem jön ki (de pl. ezért jobb az SMT-je).
De utóbbi miatt is sejthető, hogy van tartalék benne, mert kicsit gyúrnak a frontenden és nyerhetnek némi extra erőt... és a frontendet könnyebb bővíteni mint a backendet... -
Zen 1-nél is gond volt. Desktopon annyival egyszerűbb az élet, hogy maximum két CCX van. De szervereknél ez a probléma tapasztalható.
Meglátjuk, hogy mennyire segít az eDRAM cache,ami méretes lesz, már ha lehet hinni a képnek. Én szurkolok nekik, mert a technológiai fejlődés nem tart lépést az igényeinkkel. Volt időszak amikor a teljesítmény/ár javulás miatt ugyanabból a keretből megoldható volt a régi gépek cseréje és a modernizáció is. Amióta 10% körül van ez a javulás a 3-5 éves csere és a bővítés többlet forrást igényel.
Szóval én szurkolok az AMD-nek, de a hurrá optimizmusban és az AMD ajnározásban nem hiszek az FX óta, szeretném én magam kimérni azt a nagy előnyt. Az Intelnek is csak akkor hiszek, ha már legalább fél racknyi géppel bizonyított az új ragasztott procijuk és nem olvasztották el a melegfolyosó oldali ajtót.
-
zen1 nél még nem is volt annyira erős ez az "átlépés" gond, igazán nagy hátrány ott lett amikor 2 vagy több lapka volt és azon "ugrott" át az adatt... akkor volt nagy a késletetés a távoli memóriaadatok miatt...
ez azonban a közös vezérlővel teljesen eltűnhet mint gond... a memória szempontjából legalábbis... meg lehet egy L4 cache is a rendszerben (a méret alapján valószínű is, hogy van), akkor meg még inkább csökkenthető ezen "hiba"...
-
joysefke
veterán
ZEN1-nél 4db mag alkot egy CCX-et, ezekhez tartozik közös L3 cache. Kettő CCX között már nincsen közös L3 cache és a késleltetés is nagyobb.
Ha igaz amit a diagram sugall, akkor itt 8db mag fog egy szorosabb egységet alkotni közös L3 cache-vel és egymás között alacsony késleltetéssel.
Ez ideális esetben szerintem azt fogja jelenteni, hogy (miután a hypervisor ütemezőjét is felkészítették rá) maximum 8 vCPU-ig (illetve SMT-vel 16-ig, ha az ütemező nem lép át 8 fizikai magon túlra) alacsony tud maradni a késleltetés.
8 vCPU fölött nyilván hasonló (de különböző mértékű) késleltetési problémák merülhetnek fel, mint ZEN1-nél.
-
#38075904
törölt tag
Epykea? ? Ikea babérjaira akarnak törni.
-
A lényeg az, hogy mivel 4 lapka helyett 8 lapka van, ezért jobban válogatható, több vagy még magasabb órajelű csúcsprocesszort lehet összeragasztani. Ez mindig így van, lényegtelen hogy az adott gyártástechnológia vagy architektúra mit tud. A jelenlegi EPYC is emiatt tud ilyen jó perf / watt arányt.
-
devast
addikt
De te a rome-ról beszélsz amiről semmi adat nincs. Hogyan viselkedik az órajel 7nm tsmc node-al? Nem tudod. Olyan lesz-e mint a mostani ryzen a 14/12nm-en glofon-n? NEM tudhatod. Skálázódás és tdp szempontjából milyen lesz? Nem tudhatod... De azért megy a találgatás...
Továbbá forrás a cikknek nincs megadva... -
-
-
joysefke
veterán
A teszt során kiderült, hogy hiába van sok magja, ha a latency miatt 1.5x annyi magot kell a web szervereknek adni. 10% alatti különbözetért nem váltottunk technológiát.
AMD procival mekkora virtuális magszám mellett jelentkeztek ezek a magas késleltetésre visszavezethető problémák, illetve átlagosan mennyi vCPU-t osztotok ki 1-1 Web illetve adatbázis szervernek intel gépet alapul véve?
-
Dr. Akula
félisten
"Nyilván csak mutogatás céljából nem sok értelme egy-egy ilyen fejlesztés bemutatásának"
Pedig a 2990WX is leginkább csak arra jó. Ilyen áron...
-
Az igazság az, hogy hiszem ha látom. Mind a két oldalról voltak jól hangzó dolgok, de tesztelésnél kiderült már pár turpisság. 1-1 a két oldaltól:
- Az új Epyc szervert bejelentés után 9 hónappal tudta csak szállítani a HPE, egyszerűen nem került piacra. A teszt során kiderült, hogy hiába van sok magja, ha a latency miatt 1.5x annyi magot kell a web szervereknek adni. 10% alatti különbözetért nem váltottunk technológiát.
- Intel oldalon szép dolog a 18 mag 3GHz-en és jól vágja a számokat. De csak 2U-s szerverbe mertem megrendelni, mert 1U-ban szerintem átolvadt volna az alaplapon amikor meghajtjuk, mint az alienek savas vére a 8. utasban. Ha a gép megvédte volna magát, akkor meg a 3GHz nem lett volna meg. Így adott a 200W-os TDP szép pofont a nagy sűrűségnek. -
Cifu
félisten
válasz
Kronos3000 #27 üzenetére
IPC helyett tehát a magszám kezd meghatározóvá válni, jó 5-7 évig az Intel jól elvolt azzal, hogy belépő szinten 2 mag (celeron, pentium) , alsóházban 2 mag + HT (i3), középszinten 4 mag (i5), felső szinten meg 4 mag + HT (i7). Most ott tartunk, hogy minden ugrott egyet, így már belépő szinten is általános a 2 mag plusz HT / SMT, középszinten a 6-8 mag, felső szinten pedig 8 mag plusz HT / SMT.
A HEDT és a szerver piac külön állatfaj, nem a hétköznapi haladók világa, ezért azt most kihagyjuk.
Akár hogy is nézzük, nincs jobb megoldás, mint a magszám emelése, ha a számítási teljesítményt növelni akarod. Persze annak kihasználása meg a programozók ügyességén múlik...
-
Ragnar_
addikt
Arra lennék még kíváncsi, ha lenne jelenleg egy mondjuk 6400MHz-es DDR5 RAM kit ami menne AM4-ben mennyire dobná meg egy Ryzen teljesítményét... (Végülis, hogy a DDR5 mennyit lendít majd ipc-ben a Ryzen architektúrán.)
-
válasz
Kronos3000 #27 üzenetére
Ez azért van, mert nincs semmije az új EPYC ellen. Csak monolitikus lapkát tud csinálni, így most két db 700 mm2-es dögöt ragaszt össze. De ehhez új socket, alaplap, minden kell és rohadt drága lesz, szóval nem igazán lesz ellenfél.
-
Kronos3000
senior tag
Intel is elkezdett ismét legózni.Ez az egész azt jelzi számomra hogy az X86 elérkezett a határhoz,nem igazán tud már fejlődni.Ha azonos órajelen megnézi valaki haswell óta az ipc-t nincs számottevő fejlődés sem intel,sem amd vonalon.Persze jó ez sok mag sok szál magas órajel,anyám tyúkja,de az egész már véghajrára emlékeztet,nyűglődés az egész.Kellene valami új...
-
Az új IF órajele valószínűleg több, mint duplájára emelkedik (1333 -> 3200 MHz). Már ezzel a késleltetés is kevesebb lesz, mivel az eddigi ThreadRipper processzorokban lévő inter-die latency is így csökkent, ha emelted a memória (azaz az IF) órajelét: [link] Persze ezen felül még biztos lesz újítása az "Infinity Fabric 2"-nek.
-
Shin Chen
tag
Mi az az I/O lapka? Neten nem találtam egyértelmű leírástTárgytalan, megtaláltam az előző cikkben...
"lényegében tartalmazza a memória- és PCI Express vezérlőt, a déli vezérlőhidat, illetve a különféle egyéb interfészeket." -
A kérdés, hogy hogyan alakul a késleltetés a CCX-ek között. Az AMD jelenlegi platformjával is az Intelénél magasabb és ráadásul inkonzisztens késleltetés volt a gondunk. Ezen a nag mératű L4 cache és az segíthet, ha valahogy az I/O és CCX-ek közötti átvitelt felgyorsítják. Mielőtt a részletek kiderültek azt hittem, hogy a chipletek 16 magosak lesznek, hogy elérjék a 64 mag/foglalatot. Lehet ez a jobb irány a kihozatal miatt, de annak meg virtualizáció szempontjából lettek volna előnyei.
Másként megközelítve: Az Intel is összeragasztott most két CPU-t. Az ütemezőnek ott hasonló teljestményre két mag között kell elosztani a terheleést. Ebben az esetben viszont 8-ra, ami láthatóan bonyolultabb és még tanulniuk kell a különböző kernelek íróinak, hogy mi is az optimális megoldás.
-
Nirvanus
aktív tag
Kihozatal. Ennyi. Ugyanez volt Inteléknél is anno, nem?
-
Clorf
tag
Anno az Intel nem ugyanezt csinálta az első generációs corei cpu-val? A CPU mellett a GPU külön volt a lapkán egy tok alatt, talán még a gyártási csíkszélességük is más volt.
-
joysefke
veterán
totális marhaság az okfejtés...
-
Chiller
őstag
Szerintem meg az AMD-nek nincsen kapacitása ennyi chipet (chipletet?) egyesével válogatni.
A selejt viszont egyértelműen kevesebb így.
-
Elsődlegesen (főleg most) a 7 nm kihozatala miatt ilyen. De ugyanemiatt válogathatóbb is, ez biztos nagyon fontos tényező volt még. 16 lapka nem lenne jobb, mert úgy kétszer annyi IF kell, ez meg túl nagy tranzisztor overhead. A 4 lapkánál meg vagy 16 magos CCX kéne vagy 2 db CCX egy lapkába. Előbbi valószínűleg túl bonyolult, utóbbi meg értelmetlen egy lapkába. A 8 lapka jó balansz.
-
#95904256
törölt tag
Szerintem meg sokkal egyszerűbb oka van. Nagyon drága 7nm-en gyártatni és így nagyon nem mindegy, hogy egy-egy hiba miatt mekkora méretű chipet dobnak ki.
-
Oliverda
félisten
Ez az előny első Epycnél is megvan.
-
S_x96x_S
addikt
meg a Playstation 5 -höz a CPU-t is egyszerűbb lesz majd összeragasztózni.
-
devast
addikt
például tudnának mondjuk egy mostani csúcskategóriás EPYC processzornál is nagyobb órajelen üzemelő, és adott TDP-kereten belül maradó verziót gyártani
A jelenlegi ryzen tapasztalatok alapján eléggé koppra vannak járatva azok a cpu-k, még intelékhez képest is. Ez természetesen változhat rome-al, de ez megint olyan spekuláció, aminek jelenleg semmi valóságalapja nincs.
Új hozzászólás Aktív témák
- AMD Ryzen 7 5700X BOX - Új, 3 év garancia - Eladó!
- Intel Core Ultra 9 285K 24-Core 3.7GHz LGA1851
- Amd ryzen 5950x + Msi x570s carbon wifi + Team Group 8Pack Edition 32GB samsung b die .
- Intel Core i9-12900K 16-Core 3.2GHz LGA1700 (30M Cache, up to 5.20 GHz) Processzor!
- i5 12400F dobozában, még 2 hónap Aqua garanciával
- GYÖNYÖRŰ iPhone 12 64GB Green -1 ÉV GARANCIA - Kártyafüggetlen, MS3052, 96% Akkumulátor
- Bomba ár! Lenovo ThinkPad X250 - i5-5GEN I 8GB I 180GB SSD I 12,5" HD I Cam I W10 I Garancia!
- BESZÁMÍTÁS! ASUS Z170 i7 6700K 16GB DDR4 512TB SSD RX 480 8GB DEEPCOOL D-SHIELD ADATA 600W
- HIBÁTLAN iPhone 13 mini 128GB Green -1 ÉV GARANCIA - Kártyafüggetlen, MS3306
- Önerő nélkül is megvásárolható .1-10 hónap BANKMENTES részletfizetés.Arena Racer szövet gamer szék
Állásajánlatok
Cég: CAMERA-PRO Hungary Kft.
Város: Budapest
Cég: PCMENTOR SZERVIZ KFT.
Város: Budapest