Keresés

Új hozzászólás Aktív témák

  • Abu85

    HÁZIGAZDA

    válasz b. #47035 üzenetére

    Ez a konzolok miatt van. Az előző generációban a GCN néha működött, ha a találati ablakra optimalizáltál, és a fejlesztők alkalmazták is ezt a módszert, de az összes shadernek kb. a 10%-át tette ki az így megírt kód. Ezt a 10%-ot benyelte az NVIDIA, mert összességében a végeredményt mégis a maradék 90% fogja meghatározni. Tehát maga az adatlokalitás a multiprocesszor szintjén nem újdonság, de mint írtam, ritkán alkalmazott optimalizálás. Az RDNA viszont teljesen erre az ötletre épít, mert végeredményben jobb teljesítményt ad, ha a multiprocesszoron futtatott wave nem utazik a lassú memóriáig az adatért, hanem csak betölti legrosszabb esetben a multiprocesszora utolsó szintű gyorsítótárából. Egy munkaelemre levetítve ez a feldolgozási modell sokkal gyorsabb. Viszont a GCN-nél, és a többi dizájnnál ez nehezen alkalmazható, mert lehet, hogy sokan csak az ALU-k számát látják, de ha megnézed mi van a motorháztető alatt, akkor a GCN-en belül 64 ALU-ra jut 64 kB LDS, 256 kB regiszter és 16 kB L1. Ezzel szemben az RDNA-nál 64 ALU-ra jut 128 kB LDS, 512 kB regiszter, 16 kB L0 és 128 kB L1. Kapacitásban sokkal inkább ki van gyúrva az adatlokalitásra, még akkor is, ha az ALU-k száma nem módosult, itt már lehet bőven alkalmazni azt a módszert, amely az előző generációs konzoloknál csak a shaderek kis részében működött. És emiatt megy erre az új konzolgeneráció, amihez viszont igazodni kell a PC-s dizájnokkal, mert a throughputra optimalizált shader szimplán jól fut a tárkapacitásban izmos multiprocesszorokon, miközben a latency-re optimalizált shader csak ezeken fut jól. Nem nehéz módosítani a meglévő dizájnokat ilyenre, de ez a sok extra erőforrás áramot és tranzisztort igényel, nem keveset.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • TESCO-Zsömle

    félisten

    válasz b. #47035 üzenetére

    Lehet én látom rosszul ,de ezek a dolgok mindig csak kb 4-5%-on érvényesülnek, akik vagy reprezentatívak, presztízsből tolják, vagy valami partneri programon keresztül keni őket vmelyik GPU-gyártó. Aztán van még egy 10-20%, akik követik a dolgot annyira, hogy a licenszelt motook lehetőségeit kihasználják, a többi meg még azzal sem él, ami készen elé lett rakva a motorban, mert vagy nincs manpower vagy szándék, mert egyszerűen olcsóbban jönnek úgy ki.

    Sub-Dungeoneer lvl -57

Új hozzászólás Aktív témák