Új hozzászólás Aktív témák

  • S_x96x_S

    őstag

    válasz joysefke #40 üzenetére

    >Nekem nem a CCX- koncepcióval magával van gondom, ...
    > hanem azzal, hogy ezek _mellett_ a 4mag/CCX dologhoz nem nyúltak
    > és nem bővítették. (6 vagy 8 mag per CCX)

    Ha én elkezdem analizálni a problémát ( Root cause analysis ) akkor rákérdezek
    Q: miért is gyorsabb a monolitikus design ( több mag összedrótózava ) mint a ccx/chipletes?
    A: " latency + bandwidth."
    Q: Hogyan lehet ( " latency + bandwidth.") -en javítani ?
    A: Több féleképp.
    A1: picivel több magszám: (6vagy8) - de ez nem skálázható - csak részben oldja meg a problémát
    A2: picivel több programszál (thread) hasonló mint az A1.
    A3: I/O Die , Áttervezett Infinity Fabric ( skálázható megoldás ) Főleg mivel a GPU kapcsolatot is megoldja.

    Szóval akkor az A3 -re kell tenni most a fókuszt mert az a szűk keresztmetszet. Ha ezt áttervezzük, akkor mindenhol érzékelhető teljesítménynövekedést kapunk.
    Megoldja az APU ( " latency + bandwidth.") ( CPU - GPU kapcsolódási ) problémát.

    De mi legyen majd a ZEN3 -ban és a ZEN4 -ben?
    Ha a ChipHell -es legújabb infó igaz, akkor
    Zen 3: SMT4
    Zen 4: AVX512

    az SMT4 - 4 szállat jelent. Az IBM Power most SMT8-nál tart.
    ( "POWER8 provides eight SMT hardware threads/core (or SMT8)" )

    Vagyis ha igazak a pletykák, akkor az AMD a több szállas utat ( is ) választotta

    Persze ettől még lehet másik ccx-e is az AMD-nek. ( volt erről pletyka , hogy kétféle ccx-lesz )
    mindenesetre valami ok miatt az EPYC2 -ben ilyen várható.

    De az is lehet, hogy a program rosszul olvasta ki az L3-as cache-t , volt ilyen tipp is.

    Vagyis nem lehet tudni semmi biztosat.
    A teljesítményre meg végképp nem lehet következtetni azon kivül, amit az AMD eddig is megadott IPC ügyben.

    [ Szerkesztve ]

    Mottó: "A verseny jó!"

Új hozzászólás Aktív témák