Új hozzászólás Aktív témák

  • Abu85

    HÁZIGAZDA

    válasz Raymond #60322 üzenetére

    Én meg hosszabban, hogy érthető legyen. A GPU egy heterogén multiprocesszor. Van egy rakás különböző féle-fajta részegység benne, amelyek írják/olvassák a megosztott L2-t. Compute shader esetén viszonylat sok értelme van az L2 cache-nek, mert elég jó hit rate érhető el. Akár sugárkövetésnél is van értelme az elsődleges sugaraknál, mert azok koherensek. Másodlagos sugaraknál már ez megszűnik, így ott már az L2 cache nem igazán ér semmit. A BVH esetében is van némi értelme. Ezek mind olyan feladatok, amelyekben elég nagy hit rate érhető el. De vannak emellett olyan feladatok is, amelyekben nem olyan jó. Persze a tile-alapú leképezés segít, de valójában a ROP blokkok egy rakás gyorsítótársorral dolgoznak. Ezek egy része az L2-be kerül, de ugye ennek kapacitása véges, így idővel a VRAM-ig kell menni. Ebből a szempontból az L2 sosem volt jó, mert nagyon alacsony a hit rate. Ezért van a GPU-kon olyan brutál széles busz, meg gyors memória, mert ezt az alacsony hit rate-et kompenzáljuk vele. A másik opciója ennek ugye az Infinity Cache, ami védőhálóként felfogja az L2-ből helyhiány miatt kidobált gyorsítótársorokat, és esélyes, hogy a ROP blokk megtalálja őket az Infinity Cache-ben, nem kell elmenni a VRAM-ig. De ehhez elég nagy gyorsítótár kell még, és teszem azt 128 MB-nyi gyorsítótárral is csak 50% körül van a hit rate a Navi 21 esetében 4K-s felbontáson. Képzeld el azt a szegényke 4 MB-os L2-t. Ilyenre szintén volt az AMD-nek anno mérése, és 8 MB-os cache esetében van 10% környékén a hit rate. Persze a cache felépítése is fontos, például az RDNA 3 jobban használja az Infinity Cache-t, de itt nem drámai a különbség. Az AMD szerint nagyjából olyan hit rate van 96 MB-os IC-vel a Navi 31-en, amilyen 128 MB-os IC-vel a Navi 21-en. Tehát a strukturális háttér fontos, de annak javítása nem okoz drámai előnyt, azt az extra kapacitás hozza.

    #60324 GeryFlash :
    1) Az NV-nek ez a CPU-limites dolga egy nagyon specifikus tényező. Nem minden játékot érint, mert bizonyos dolgok szükségesek ahhoz, hogy előjöjjön. Például az, hogy a Microsoft és ne az NV ajánlásait kövesse egy fejlesztő a D3D12 leképező írásakor. Mert ugyan a D3D12-ben mindkét cég utazik, de több helyen homlokegyenest ellenkező dolgot ajánlanak.
    2) Azért raknak bele több cache-t, mert heterogén multiprocesszorok a GPU-k. Attól, hogy a ROP-ok hit rate-je nem túl jó, még a compute feladatoké jellemzően az. Csak ugye egy játékban döntő tényező a ROP, tehát ez rontja a működést.

Új hozzászólás Aktív témák