Új hozzászólás Aktív témák

  • Abu85

    HÁZIGAZDA

    válasz b. #51477 üzenetére

    Ez egy teljesen eltérő probléma. De segítek megérteni. Tegyük fel, hogy van egy GPU-d, aminek a memória-sávszélessége mondjuk 1 TB/s, FP8 mellett pedig mondjuk 600 TFLOPS-ra képes a mátrixfeldolgozója. Ha még fel is osztod a tartalom feldolgozását mozaikokra, akkor is nagyon kicsi mozaikok kellenek, hogy ne a sávszélesség legyen a limitáció, és ilyen kis mozaikok mellett jelentős számítási overhead van, hogy jól összeilleszthető legyen a végső kép a mozaikokból. Tehát a mostani működési modellel legjobb esetben is eldobod a hardverben rejlő számítási teljesítmény legalább 70%-át, mert olyan adatokat számol ki, amelyeket végül nem használsz majd fel a megjelenő képhez. Ha viszont az overheadet csökkented, hogy több kiszámolt adatot hasznosíts, akkor nagy lesz a mozaik ahhoz, hogy a számítás ALU-limitált legyen, vagyis nem fogja a hardvered elérni a beletervezett 600 TFLOPS-ot, hanem teszem azt 200-250 TFLOPS-ot hoz belőle, mert a memória elérési sebessége limitálja a skálázást.

    Ezért van az, hogy a nagy AI gyorsítók HBM-et használnak, mert kell a több 10 TB/s, csak ez végfelhasználói szinten nem realitás, senki sem fogja megvenni az 6000 dolláros VGA-t, a 3000 dolláros középkategóriáról nem is beszélve.

    Emiatt a következő körben okosabbnak kellett lenni, így már a Sony-nak felmerült az az ötlet, hogy itt igazából csak a memóriabusz a szűkös, de ha a számítások eredményei nem kerülnek erre a buszra, hanem a GPU-n belül maradnak, akkor van 200 TB/s-od is. És ez született a PS5 Pro nagy felfedezéséhez, hogy bizony ezeket a számításokat nagyrészt a GPU-n belül lehet tartani, hogy ne is terheljék a memóriabuszt. De ez a koncepció, amihez azért kellett hardveres változás is, még egyik PC-s GPU-ba sem kerül
    implementálásra. Viszont a következő generáció már erről fog szólni, mert túl jó dizájnötlet ez, hogy elmenjenek mellette a cégek. Csakhogy ez automatikusan azt jelenti, hogy olyan nagy lesz a különbség a next-gen és a jelenlegi dizájnok között, hogy a next-gen effekteket a jelenlegi hardverek nem fogják tudni jól futtatni, még akkor sem, ha a kód amúgy kompatibilis lenne. Ez egyébként érthetően marha gáz, de ahhoz, hogy grafikailag előrelépjünk szükségünk van ezekre a hardveres képességekre. Aztán, ha valaki nem akarja őket, akkor nem futtatja a legújabb effekteket és játszik az alap minőségen. Ez se baj, nyilván erre is lehetőség lesz.

Új hozzászólás Aktív témák