Új hozzászólás Aktív témák
-
Abu85
HÁZIGAZDA
A dolog ennél bonyolultabb. Valójában a problémát a DirectX 12 jeleneti az alkalmazáson belül. A Borderlands 3 a Microsoft ajánlásait követi a DirectX 12-re, ami azt jelenti, hogy az erőforrásokat a leíróhalmazba rakják. Ez az AMD-nek és az Intelnek jó, de az NVIDIA hardvereinek, köztük még az Ampere-nek is nem ideális. A GeForce-okhoz az az ajánlott, hogy az erőforrások a root signature-be kerüljenek.
Ezt az ajánlást némelyik program teljesíti, némelyik nem. A helyzet nem olyan egyszerű, mert a root signature-t nem buffer viewekre találták ki. Ha ide helyeznek erőforrást, akkor számos formátum nem is támogatott. Ilyenkor a leíróhalmazok alkalmazása elkerülhetetlen, és ezzel az NVIDIA hardverei teljesítményt veszítenek. Ezért van az, hogy az AMD minden DirectX 11-ről DirectX 12-re váltásnál előnyt kap, míg az NVIDIA esetében vagy előnyös ez a váltás, vagy hátrányos. Attól függ a pozitív vagy negatív irány, hogy a buffer viewek a root signature-ben vagy leíróhalmazokban vannak.
Ha lehet a fejlesztők beleerőszakolják ezeket a root signature-be, mert az AMD és az Intel hardverei ilyen működés mellett is jól érzik magukat, a GeForce-ok pedig csak így működnek optimálisan, de mivel ez egy nem ajánlott működési mód, a Microsoft nem készítette fel minden formátum támogatására, így sokszor nincs választásuk a fejlesztőknek, és muszáj leíróhalmazt használni, azt pedig a GeForce-ok annyira nem szeretik.[ Szerkesztve ]
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
-
Malibutomi
nagyúr
Nem a szamitasi teljesitmennyel van a gond hanem ahogy irtam ez csak elmeleti es igazabol nem tudjak kihasznalni. Csak egy nagy szam.
A 3080 conpute teljesitmenye 220%-a a 2080ti-nak megis atlagosan 35%-al gyorsabb. Meg full RT benchmark alatt is csak 45% koruli a kulonbseg.
Az a 30tflops csak egy elmeleti szep szam, valojaban olyan 75%-ban mozgosithato.
Pont mint a regebbi AMD kartyak hiaba tudtak papiron tobb tflops teljesitmenyt mint az NV kartyak nem tudtak kihasznalni.
-
Malibutomi
nagyúr
Az elmeleti 30Tflops lebegopontos szamitas ugy jon ki hogy elvileg minden core tud ket FP utasitast vegrehajtani orajelenkent VAGY 1 FP es 1 INT utasitast.
Gyakorlatilag mindig lesz olyan core amelyiken INT utasitas fog futni...vagyis a valosagban sosem fog 2 FP utasitas futni as osszes core-on egyszerre. Legalabbis nem normal felhasznalas alatt. Maximum specifikus celprogramokban.Ez nagyon leegyszerusitett de kb igy nez ki a dolog.
-
Abu85
HÁZIGAZDA
Az AMD-ben lesz dedikált RT részegység. [link] - itt leírtam, hogy mi lesz a két implementáció között a különbség.
(#65) Malibutomi: Nem az Int32 a lényeg. Abból viszonylag kevés van egy programban. A legnagyobb gond a függőség, mivel mindkét feldolgozótömb ugyanazt az ütemezőt használja. A SIMT dizájnoknál a függőség korábban azért nem volt gond, mert feldolgozótömbönként egy külön volt, tehát egymástól függő wave-ek ugyan kerültek az ütemezőre, de ezeket sosem lehetett párhuzamosan futtatni két feldolgozótömb hiányában. Az Ampere egy ütemezőre két FP32-es feldolgozótömböt rak, és ott már lényeges, hogy két wave csak akkor futhat egymás mellett, ha nem függnek egymástól. Ez sokkal sűrűbben jelent problémát, mint az, hogy van Int32-es feladat.
Egyébként erre lehet optimalizálni, a probléma az, hogy piszok nehéz, és alapvetően sok haszna sincs a befektetett humánerőforrásnak, mert ha egy operáció függ a másiktól, akkor azt sosem lehet majd egymással párhuzamosan futtatni.
Az Ampere-re majd kell külön optimalizálni, mert amíg a két konzol kifejezetten azokat a shadereket szereti, amelyek az adatlokalitásra vannak optimalizálva, addig az Ampere ezt kifejezetten utálja. És ez egy lényegesebb kérdés, mint 16+16 co-issue módra gyúrni, mert sokkal többet vesztesz a rossz statikus erőforrás-allokációval, mint azzal, hogy nem működik a második FP32-es feldolgozótömb.[ Szerkesztve ]
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
SindaNarmo
tag
Mert nem lett bemutatva semmi, csak kaptál egy kis ízelítőt. Pl az NV sem a 3090-et mutogatta, hanem a 3080-at hogy mennyire szuper, aztán meg ja de van ami még ennél is jobb.
Illetve ha tudom hogy van jobb, akkor minek lőjem el a puska port a tényleges event előtt?
Persze ettől függetlenül nem zárható ki hogy igazad van, csak akkor teljesen felesleges és értelmetlen volt egyáltalán ennyit is mutatni belőle.
[ Szerkesztve ]
-
Felesbandi
senior tag
Nincs ez a Ray Tracing kicsit tulhype-olva?
Neztem rola videokat, hogy milyen es nem mondhatom, hogy a latvanytol hanyatt vagtam volna magam. Lehet, hogy a videokon nem jott at megfeleloen, de az eddig latottak alapjan elso dolgom lenne minden jateknal, hogy kikapcsoljam. Nekem egyaltalan nem eri meg a performance hit-et, amit eredmenyez es ketlem, hogy ezzel egyedul lennek.
Új hozzászólás Aktív témák
- Autós topik látogatók beszélgetős, offolós topikja
- Redmi Note 13 Pro 5G - nem százas, kétszázas!
- Debrecen és környéke adok-veszek-beszélgetek
- Már elérhető a Resident Evil 4 Remake magyar szinkronja (PC)
- gban: Ingyen kellene, de tegnapra
- Azonnali informatikai kérdések órája
- Rövid előzetesen a S.T.A.L.K.E.R. 2: Heart of Chornobyl
- Tippmix
- bitpork: Fogyasztásra ítélve
- Automata kávégépek
- További aktív témák...