Új hozzászólás Aktív témák
-
válasz #65675776 #50 üzenetére
Úgy látom te is megértetted
Talán az AMD nem engedheti meg magának hogy legyen egy 8, egy 18, meg egy 28 magos dizájnja is?
Vagy csak jobban megéri nekik megcsinálni egy dizájnt ami aztán jó a 4, 6, 8, 12, 16, 24, 32, 48, 64 magra is?
Nem mondtam hogy több CCX/chiplet design legyen és azt sem mondtam, hogy hatalmas legyen egy CCX. Azt mondtam, hogy a 4mag/CCX egyértelműen visszafogja az architektúrát.
14-ről 7nm-re lépve bőven nő annyit a tranzisztorsúrűség, hogy beleférjen 4 helyett 6 vagy 8 mag abba a CCX-be.
Vannak előnyei a monolitikus chipeknek is, de legalább annyi hátrányuk is, ha nem több. A gyárthatóság egyre nagyobb probléma lesz, elvégre az egyre kisebb csikszélességek egyre drágábbak, tehát a rossz kihozatal egyre nagyobb veszteséget jelent.
Talán el kéne olvasni -és értelmezni- hogy mit írtam. Mégis hol írtam én, hogy monolitikus processzort gyártsanak?
-
S_x96x_S
őstag
>Azt mondtam, hogy a 4mag/CCX egyértelműen visszafogja az architektúrát.
32, 48 és 64 (128 !?) magnál extrém minimális az a visszafogás amitől te tartasz.
és itt már a most javított I/O die (Lattency+bandwith) számít.
egy 8 magos AM4-es procinál persze ez is fontos lehet,
de egy erre optimalizált AM4-es I/O die -al itt is lehet (Lattency+bandwith) hasonlóan emelni a sebességet.durva példa:
- I/O die (L4?) cache - hozzáad mindenhez +12% sebességet.
- Az L3 cache szintén hozzáad +3 %-ot
- A 2x 4ccx -es kivitel - meg néhány esetben levesz 5% sebességet.Ha jól csinálják, akkor a pozitiv fejlesztések ellensúlyozzák a néha megjelenő hátrányt a 4magos ccx -es kiviteltből eredendően.
Mottó: "A verseny jó!"
-
32, 48 és 64 (128 !?) magnál extrém minimális az a visszafogás amitől te tartasz.
Honnan veszed, hogy "extrém minimális" lesz sok mag mellett? Egyrészt még nincs kint, másrészt jelenleg a ZEN-nél sem minimális ez: mind deszktopon mind szerveren vannak olyan feladatok ahol lényegesen gyengébben muzsikál a ZEN+ mint a konkurencia ezek pedig jelenleg a CCX<-IF->CCX kommunikációra vezethetőek vissza.
Deszktopon ez úgy tűnik semennyire nem fog változni, ugyanúgy megmarad a <4-mag> <=IF=> <4-mag> rendszer mint potenciálisan szűk keresztmetszet kicsit javított késleltetésekkel. Játékokban ez továbbra is vissza fog ütni.
-
S_x96x_S
őstag
>Honnan veszed, hogy "extrém minimális" lesz sok mag mellett?
>ezek pedig jelenleg a CCX<-IF->CCX kommunikációra vezethetőek vissza.64 magnál ugyanúgy megmaradnak a CCX-ek - nem lesz monolitikus design.
úgyanúgy kell kommunkálni.
A te javaslatoddal csak részben lett megoldva a probléma.
Viszont a többi fejlesztéssel ezt a problmát minimalizálni lehetett.A ZEN1 érzékeny volt a memórisebességére és a késleltésre. Ha ezt lecserélik és duplázzák az L3-at,
akkor a te általad jelzett ZEN1-es problémát minimalizálták.A mostani konkurenciával meg hiába hasnlítod össze. extrém magszám felett ők is ragasztóznak.
>Deszktopon ez úgy tűnik semennyire nem fog változni,
>ugyanúgy megmarad a <4-mag> <=IF=> <4-mag> rendszer
>mint potenciálisan szűk keresztmetszet kicsit javított késleltetésekkel.Az Intel monolitikus designjával ne hassonlítsd össze, főleg mert
az új Intel desing (dual-ring?) meg lehet, hogy másolja az AMD-t.
"
There is also some suggestion Intel might utilise a dual ring bus design for this Comet Lake chip, instead of the single ring bus used for the i9 9900K, or the mesh design picked up by the similarly ten-core i7 7900X and upcoming i9 9900X. That’s an intriguing thought and could possible suggest a move to something more akin to AMD’s CCX design.With this Comet Lake rumour that would potentially suggest a pair of either five- or six-core chips (with one core disabled) arrayed in a similar way to the quad-core CCX of Ryzen. And that sort of setup will need a whole lot of space.
"
https://www.pcgamesn.com/intel-comet-lake-cpu-10-core-14nmHa az Intel össze tud rendesen ragasztózni 2 chipletet - akkor az AMD-nek is képesnek kell lennie rá.
>Játékokban ez továbbra is vissza fog ütni.
meglátjuk mivel kompenzálja ezt az AMD. Ha lesz egy böszme nagy L4-es cache, akkor kevésbé lesz érzékeny a DDR4 memória sebességére , jobb lesz a játékoknál is.
és nem lehet annyira észrevenni mint most.Mottó: "A verseny jó!"
-
#95904256
törölt tag
Nem egészen értem, hogy miért látod jelentős problémának, hogy csak 4 mag osztozik az L3-on és a többi magot csak buszon keresztül tudják elérni. Nézd meg pl. a sokmagos Intel szerverprocesszorok felépítését ( Skylake-SP ):
Itt minden mag a buszon csücsül a saját kis L3 cache darabkájával. Ők sem problémáztak rajta.[ Szerkesztve ]
-
válasz #95904256 #55 üzenetére
Nem egészen értem, hogy miért látod jelentős problémának, hogy csak 4 mag osztozik az L3-on és a többi magot csak buszon keresztül tudják elérni
Két okból:
0,
A legnagyobb probléma, hogy van pár fontos applikáció ahol a ZEN1/1+ már bebizonyította, hogy problémákba fut a jelenlegi "4 mag/CCX + IF" konstrukció. Játékok, Adatbázisok, Webszerverek(?). https://www.anandtech.com/show/11544/intel-skylake-ep-vs-amd-epyc-7000-cpu-battle-of-the-decade/181,
Mert így az L3$ sok kis darabra oszlik. Ha pld 16 db CCX van egyetlen processzorban, akkor a teljes L3$ 16 db szeletkében van. Ha pld 8db CCX-ből oldanának meg ugyanakkora magszámot (kétszer annyi mag per CCX) akkor kétszer akkora lenne egyetlen L3$ szeletke. 16x 16MB-nál sokkal jobb a 8x 32MB.2,
Az Intel topológiában amit linkeltél, még így is sokkal alacsonyabb a cache késleltetés annál, mintha az Epyc1-ben egy a lokális CCX- L3 cachén kívüli adatot probálnál elérni:https://www.anandtech.com/show/11544/intel-skylake-ep-vs-amd-epyc-7000-cpu-battle-of-the-decade/13
Még egyszer, nem azt mondom, hogy a CCX+IF/Chiplet nem volt hatalmas ötlet. Azt mondom, hogy a 4x Core/CCX design mind desktopon mind szerveren is bizonyos feladatokban érezhetően gyengélkedik. Nem minden feladatban, de van ahol nagyon. ennek megfelelően én azt vártam, hogy ezt a keresztmetszetet kibővítik legalább 6 de inkább 8 mag/CCX-re.
-
#95904256
törölt tag
0: Ha a linkelt tisztben valóban a CCX-ek közti kommunikáció miatt szerepelt rosszul a ZEN, akkor jó hírem van. A Zen2-ben sokkal kisebb késleltetésű lesz az IF, így máris jelentősen csökken az értelme annak, hogy 4mag/CCX-ről egy lassabb L3-mal rendelkező, de 8magos CCX-re váltsanak.
1: Az általad linkelt tesztben szereplő Intel processzorokban még több és kisebb részből áll össze az L3. Mégis jobb eredményt produkálnak, nahát... lehet, hogy mégsem itt van a kutya elásva.
2: "Az Intel topológiában amit linkeltél, még így is sokkal alacsonyabb a cache késleltetés" Feltetted a kérdést, hogy vajon miért? Azért mert a gyűrűs buszuk jóval kisebb késleltetésű. Jó hírem van! A Zen2-ben sokkal kisebb késleltetésű lesz az IF!
Nahát, két pontban is az jött ki, hogy inkább a magok közti busz sebességére kell gyúrni.
Szóval érted, az a probléma amit említettél orvosolható azzal, hogy erre gyúrnak.
Új hozzászólás Aktív témák
- Beszámítás! Intel Core i9 9900K 8mag 16szál processzor garanciával hibátlan működéssel
- Intel I9 14900KS 24mag/32szál - Új - Eladó! 250.000.-
- AMD AM4 Processzorok - Ryzen 3 / 5 / 7 / 9 - Új - Garanciás
- Intel I7 12700KF 14mag/20szál - Új, Tesztelt - Eladó! 85.000.-
- Beszámítás! Intel Core i7 4790K 4mag 8szál processzor garanciával hibátlan működéssel
Állásajánlatok
Cég: Ozeki Kft.
Város: Debrecen
Cég: Ozeki Kft.
Város: Debrecen