Új hozzászólás Aktív témák

  • Petykemano

    veterán

    válasz And01 #6 üzenetére

    Szerintem az egyszálas ">15%" matek úgy jön ki, hogy
    - a CB nem reagál jól a csupán duplázott L2$-re, mint ahogy nem reagált a V-cache-re sem. A Zen3 IPC táblázatában is elég elöl szerepelt, vagyis lefelé húzta az átlagot. Ne felejtsük el, hogy az Intel most minden generációban tweakeli az architektúra szélességét, ROB, meg egyéb bufferek kapacitását. A Zen4 valószínűleg ilyen szempontból kevéssé nyúl hozzá az architektúrához, nagyon leegyszerűsítve, tényleg csak az L2$
    - A CB egy FP teszt. Azt láttuk, hogy az Intel milyen durva frekvencia visszaeséseket szenvedett el AVX2 és AVX512 használata közben. Tehát könnyen lehet, hogy nem erős FP számítás közben éri el a Zen4 a pletykált 5.8Ghz-et.

    Ha mondjuk CB csak 2% IPC növekedést realizál és csak 5.5Ghz-en ketyeg közben, akkor máris kijön az 15%
    De attól még lehetnek más workload-ok, amelyek során kihajcsa az 5.8Ghz-et és ami jobban reagál az L2$ duplázódásra.

    Hogy miért annyival magasabb a MT teljesítménynövekedés, azt szerintem a következők magyarázhatják:
    - Elképzelhető, hogy az N5 gyártástechnológia nagyobb mértékben volt képes emelni az órajelet MT esetén.
    - Elképzelhető, hogy a duplázott L2$ leginkább SMT használat közben segít jobban adattal etetni a szálakat és azért tapasztalható nagymértékú MT teljesítménynövekedés. Vagyis a duplázott L2$-nek köszönhetően a MT IPC nagyobb mértékben növekedhetett, mint ST esetén.

    Találgatunk, aztán majd úgyis kiderül..

Új hozzászólás Aktív témák