Új hozzászólás Aktív témák

  • Petykemano

    veterán

    az AT-en lejött a részletes teszt és elemzés

    Ez a Milan nem tűnik egy olyan minden szempontból jól sikerült fejlesztésnek, előrelépésnek, mint a Rome volt. Vagy nem sikerült, vagy másként megfogalmazva arról van szó, hogy meghatározott célok voltak fókuszban.

    Az asztali zen3 esetén is érezhető volt, de szerintem deklarált cél is, hogy a ST teljesítményen javítsanak. Ez sikerült is. Más kérdés, hogy szerverpiacon mennyire lehet fókusz a ST teljesítmény?

    A CCX 4-ről 8 magosra emelése látszik a latency ábrán. Ez tök jó lehet akkor és ott, ha cloudban kell kiosztani magokat, akkor már esik a teljesítmény 4 mag felett. pl cloud gamingnél ez lehet, hogy sokat számít. Más jellegű VM-ek esetén nem tudom, hogy a hypervisor a CCX-ekre tekintettel volt-e egyáltalán.

    De a késleltetés még azért felemás. 8 magon belül nagyon jó, de azért az ampere 80 magot átfűző 50-60ns-os késleltetése elég versenyképes. Ez nyilván azzal függ össze, hogy a L3$ csak 8 magot fűz össze, míg az Altra esetén - gondolom - a 80 mag közösen használ 32MB L3$-t. Ez megint az, hogy chipleten kívüli kommunikáció gyakorlatilag a memórián keresztül történik (ehhez a 110ns-hoz nagyon hasonlatos a memória elérés késleltetése)
    Ezeken a késleltetési számokon biztosan segítene egy L4$ az IOD-ban. Ennek nem feltétlenül kell olyan nagynak lennie, hogy az összes chiplet L3$ tartalma elférjen benne. Az Ampere esetében is feleakkora az L3$, mint az L2$-ek összkapacitása. Persze más kérdés, hogy vajon cél-e a mag-mag kommunikáció késleltetésének javítása, sokkal inkább a memória elérés késleltetének javítása lenne hasznos. Ilyen biztos nem lesz azelőtt, hogy 7nm-re váltanak.

    A multithread teszt eredmények nem olyan meggyőzőek. Egyrészt jelentősen nőtt a fogasztás. Másrészt az Ampere Altra versenyképesnek tűnik.

    Tekinthetjük persze úgy, hogy a fókuszban most a kis és közepes szerverek voltak, ahogy Abu mondta. Mini-Epyc, mondjuk 16-24 mag, ahol viszont nem biztos, hogy csak a maximum throughput számít, hanem az is, hogy egy-egy szál mennyire gyorsan tud végezni.

    az AT azt írta egyébként, hogy az IOD kapott egy redesignt. Elvileg ennek köszönhetők a jobb késleltetések, a magasabb FCLK és persze a magasabb idle fogyasztás.

Új hozzászólás Aktív témák