-
Fototrend
A legtöbb kérdésre (igen, talán arra is amit éppen feltenni készülsz) már jó eséllyel megtalálható a válasz valahol a topikban. Mielőtt írnál, lapozz vagy tekerj kicsit visszább, és/vagy használd bátran a keresőt a kérdésed kulcsszavaival!
Új hozzászólás Aktív témák
-
füles_
őstag
válasz
Obliterátor
#33299
üzenetére
A Navi már várhatóan GCN6 lesz, ha erre gondolsz.
Viszont ez a "hír" egy hatalmas nagy BS. Ilyeneket nem kell elhinni. Már évek óta jönnek az efféle pletykák mindenegyes új GCN verzió megjelenése után, hogy a következő széria ebben az évben és ebben a hónapban fog megjelenni, eddig ez egyszer sem jött be.
GF 7nm várhatóan csak 2018 végén lesz, de szerintem lesz abból még 2019 eleje is. Szóval a Navi valamikor majd 2019 első felében fog jönni. Addig várhatóan lesz még egy 12nm-es Vega számunkra. -
Obliterátor
tag
Ez akkor már a next gen lesz?
-
Abu85
HÁZIGAZDA
válasz
Ren Hoek
#33290
üzenetére
Ezeket nem látják a partnerek. Nem szükséges információt szerezniük róluk. Emiatt ezekről mi sem szerzünk információt.
Amiket írtam azok semminek sem az előkészítései. Önálló modulok. Az OSD-ről régóta tudni. Már kép is volt róla egy korábbi hírben. Az benchmark modul lényegében OCAT integráció. A program kész, csak be kell rakni. A Chill és az Enhanced Sync kiterjesztése csak tesztelés kérdése. A modulok alapjai készek. Az egyetlen ténylegesen új modul a shader injektor. Ez pedig nem shader csere, hanem hozzáadás. Olyan, mint a Reshade vagy az ENB Series, csak gyárilag. Elsődleges indok mellette, hogy a DX12 és Vulkan API-ban a Reshade/ENB nem működik, és nem is tudják megoldani a működést a driver forráskódjának ismerete nélkül.
-
#45997568
törölt tag
-
Ren Hoek
veterán
válasz
Malibutomi
#33288
üzenetére
Igen én pontosan erre gondoltam... (Bocs mindenkitől, nem provokációnak szántam...). Nekem a csodadriver mindig is az volt, amely valami áttörő változtatást hoz... pl a DX12 annak idején. Mondjuk az nem lett akkora durranás, csak szépen lassan ért be.
...de mindenféle gúnyon kívül, itt most a Vega off feature-kre gondolok. Nekem ezek most nem tűnnek annyira annak, inkább az előkészítése a funkcióknak? (Shader csere?) -
-FreaK-
veterán
válasz
#45997568
#33286
üzenetére
Nem érted. Nem driverekre, hanem jön elvileg _egy_ alaposan kipofozott driver, amiben működni fognak szintén elvileg a Vega új szolgáltatásai. Ahogy közben Abu le is írta.
Mivel a Vega eleve ezen szolgáltatásokkal lett tervezve, ezért várható, hogy jelentősen megdobja a teljesítményt, sőt még akár a kártya fogyasztását is csökkentheti.
Az is lehet, csak minimális lesz a sebességbeli előny, ezt egyelőre itt senki nem tudja megmondani, de az esély megvan a "csodára". Innen a név..Amúgy meg szerintem igen is vicces, és azt hogy én mit tartok szánalmasnak, azt inkább nem írom le, mert nem ide való.
-
Abu85
HÁZIGAZDA
válasz
Ren Hoek
#33280
üzenetére
Nem tudom, hogy mit tudtok eddig, arra sem emlékszem, hogy mik voltak hivatalos infók korábban. De tessék pontokban, amit most tudni.
- Redux a kódneve.
- 17.320-as a batch.
- Lesz benne integrált OSD.
- A Chill modulja sokkal több játékot fog támogatni a mostaninál, akár az összeset, de az elterjedt motorra épülőket tuti.
- Elvileg lesz Enhanced Sync a régebbi GCN-eken is.
- Beépített benchmark modul is van a tesztmeghajtóban. Gyakorlatilag az OCAT integrálva.
- Nemrég bekerült egy shader injektor modul is. Ez elvileg azt tudja, amit az ENBSeries, csak integrálva. Ez azért lényeges, mert DX12 és Vulkan alatt az ENBSeries, Reshade és hasonló injektorok már nem működnek, a rajongók nagy kárára. Tehát meghajtóba épített injektorokat lehet csak használni. Egyedi shadereket is támogat, tehát bármilyen játékra rá lehet erőltetni egy extra post-processt. Be kell tölteni is lefuttatja, akár olyat is, amit a user ír.Egyelőre ennyit tudni.
-
-FreaK-
veterán
válasz
#45997568
#33284
üzenetére
Mit kellene elfelejteni? Ez egy kissé gúnyos, kissé vicces kifejezés arra, amit Abu írt pár hete/hónapja, hogy decemberben várható az első "normális" driver, amiben már minden új funkció működőképes lesz. Sőt, azt is írta, hogy mivel ez kb. a Vega11 érkezésével egy időben fog megtörténni, ezért az új driverrel a Vega10-et is újratesztelik majd.
Van aki hisz ebben, van aki szkeptikus (nem alaptalanul). Minden esetre ezt csak és egyedül Abu-tól hallottuk eddig, sehol nem említettek még csak hasonlót sem netszerte. Amennyire én tudom.
Úgyhogy addig is részemről is Wonderdriver™ FTW!

-
#45997568
törölt tag
válasz
Valdez
#33283
üzenetére
Ezt adja ki, az elso VGA-val kapcsolatos is NV, szoval ezt el lehetne mar felejteni

-
#45185024
törölt tag
-
Ren Hoek
veterán
Van valami hír a csodadriverről? Továbbra is december?
-
#45185024
törölt tag
Testing Primitive Binning With Vega 10 On RadeonSI
One month back Marek Olšák landed support in the RadeonSI Gallium3D driver for primitive binning with Vega 10 GPUs but now that feature is likely to be disabled by default. Marek is moving ahead now to disable primitive binning by default for Vega 10 GPUs but to keep it enabled for upcoming Raven Ridge APUs -
#45185024
törölt tag
-
#45185024
törölt tag
Pesten át lehet venni 171 ezerben Mivel 40 forintot nőtt a font.
De a kérdés az inkább az hogy Nexus C1 chipekkel mért, de a Giga már nem ezt mondta:
"Gigabyte changed their story after they received a new batch of Vega chips) the company is indeed making a custom Radeon RX Vega 64."
Magyarán miután nem a C0-t kaptál úgy már akartak 64-et csak kérdés a régi chippeket hova pakolják mert necces azt 56-ba és akkor már lesz is eltérés húzásban.
Amúgy ez az Október Novemberi custom is necces mert már decemberben Macnak nyomják gőzerővel, és az nem a "lehet hogy lesz" kategória hanem szigorú darabszám és szerződés köti őket, félő hogy ennek is a custom ellátottsága bánja kárát. -
-
-FreaK-
veterán
válasz
#45185024
#33264
üzenetére
Elmondja, hogy beszélt másokkal is és általános vélemény, hogy az 56-ok kicsivel tovább húzhatóak szinte minden esetben. Persze kell bűvészkedni hozzá (64 bios flash), de azért akkor is. Gyakorlatilag nincs különbség a kettő között, ha rászánod az időd a tuningra. A frekvenciákról is beszél, hallgasd végig.
-
#45185024
törölt tag
válasz
-FreaK-
#33263
üzenetére
Ennek azért az az alapfeltétele hogy azonos órajelen is pl 1680Mhz-en tudjanak menni.
A memória sem megy alapon 1100-al az 56-on. De ha minden feltétel teljesül valóban nem sok a pár %.
64 azért jobban tuningolható ilyen 26 ezres GS-eket is mérnek csak a driver jelenlegi állapotában Nem éri meg nagyon OC-olni hacsak nem valami dicsőség táblára akarsz felkerülni
56 Best of EU
Csak a Font ne szálljon el a customig, úgy értem az erős XFX, Sapphire customig -
-FreaK-
veterán
Revisit: Vega 56 & 64 at Same Clocks (800-1020MHz HBM2)
Vega 56 vs 64 azonos órajelen. Összefoglalva: A 64 előnye legtöbbször hibahatáron belüli, ahol nem, ott is csak 1-4%. De! Az 56-al többnyire kicsit magasabb órajelek érhetőek el mint a 64-el.
Ez alapján nem éri meg a nagyobbikat venni egyáltalán. Kérdés, hogy lesz-e változás a driverekkel. -
deja vu
addikt
válasz
FollowTheORI
#33261
üzenetére
Ja tényleg nagy, de először az egyik legolcsóbb Windforce hűtőnek néztem ami belépő a Giga kínálatában. A zöld konkurenciánál komolyabbakat láttam. Meg én elsőnek valami ütőset virítanék nyálcsorgatónak, ez nem tűnik annak számomra. Na majd a Giga Xtreme, Waterforce, meg Aorus brutál lesz.
-
-
Yutani
nagyúr
-
Omli85
őstag
válasz
Petykemano
#33256
üzenetére
Minden maxon Vsync-el 4K-ban is tartja a 60 fps-t nálam az RX Vega 56@64-es biossal. Ugyan én a demóval próbáltam csak ott meg amúgy is sajna 60-as limit van.
-
válasz
Németh Péter
#33252
üzenetére
Itt az eredeti teszt is.
Meglehetősen szokatlan módon az nVidia kártyák előbb ütköznek CPU-limitbe, mint a Radeonok, ill. a Maxwellek nem nagyon szeretik a játékot. A Radeonok viszont majdnem uniform erősek, amikor nem játszik a CPU-limit, akkor is 5-10%-kal a status quo felett teljesítenek (leszámítva a Fury X-et 4K-ban). Nem rossz... -
UnSkilleD
senior tag
válasz
Németh Péter
#33252
üzenetére
ugyanaz mint a dirt4ben, alacsonyabb felbontáson lenyomja a geforceokat de magasabb felbontáson szépen megfordul
-
Érdekes, hogy a Vega 64 lenyomja a 1080Ti-t a Forza 7-ben.
http://www.guru3d.com/news-story/forza-7-pc-graphics-performance-benchmarks.html
-
válasz
lezso6
#33247
üzenetére
Ez már nagyon off, de:
- Az 1070 órajele papíron alacsonyabb az 1080-nál, viszont az első tesztekben az 1070 FE-k magasabb órajelen mentek, mint az 1080-ak
- Szerintem az 1060 és az 1080 közötti különbség rendben van - így a midrange a highend kb. 2/3-át hozza, kevesebb, mint fele áron.A 480 csak a ROP-okból kevesebbet profitálna - sőt, lehet, hogy alig valamit, mivel a Radeon ROP-ok a legtöbb színformátumot sima rajzolás és blending mellett is 1 op / clk sebességgel tudják. Ha 3 SE lenne benne, akkor 48 pixel / clk lenne a raszter is meg a ROP is, az már jó lenne. Vagy ha 1 SE 16 helyett 24 raszterműveletet tudna.
-
-
#45997568
törölt tag
válasz
Hegyirabló
#33248
üzenetére
Kb ennyi, esetleg majd a Radeon szoftvereben meg kell nezni hogy bekapcsolta-e automatikusan magatol.
-
Jó estét kívánok a Kollégáknak!
FreeSync ügyben szeretnék segítséget kérni!
Ha jól értem, kell hozzá egy kártya, ami támogatja (van), kell hozzá, egy kijelző, ami támogatja (lesz), össze kell kötni őket display porton, és ta-damm? Vagy kell még valami hozzá?
Nagyon megköszönöm a megtisztelő segítségeket!
-
Ja, a Hitman meg a Tomb Raider játékoknál elég komoly limitbe futott a 960. A részletekben rejlik az ördög.

GDDR5X az 1060-hoz az hujjajj.
De az ~60% körüli különbség az 1080-hoz képest azért nem valami jó. És az 1070 és 1080 különsége azonos órajelen szintén elég gyér, ~15% körüli. Az 1070 nem véletlen, hogy kapott 7% órajel mínuszt, különben túl közel lennének. Az 1060 viszont ezzel a mínusszal is virgonc tud lenni. A ROP-raszter aránnyal kapcsolatos kiegyensúlyozatlanság érvét nem értem, mivel az RX480 is az lenne 48 ROP-pal, mégis tudna elvileg profitálni belőle. 
-
válasz
lezso6
#33243
üzenetére
Valami nem teljesen OK azzal a TPU teszttel - a 960 és a 970 között jellemzően 50-60% szokott lenni, ebben meg 73%. A 960 és a 980 között durván 80% az eltérés, ez direktben sajnos elég kevés tesztben látszik, csak következtetni tudok abból, hogy a 980 cca. 15%-kal van a 970 előtt.
A Pascalnál valószínűleg a memória miatt választották a 3db backend modult - az 1060 profit marginját agyonnyomta volna a gDDR5X, meg marketingben is elég visszás lett volna az 1070-nel szemben. Ha meg marad a 128-bit + 8Gbps, akkor ugyanolyan béna kacsa lett volna, mint a 960, és a Polarisok ledarálják a p***ába
A plusz ROP-ok valamennyit biztosan érnek, de ez limitált, mert raszterműveletben csak 32 / clk a GP106.Az utolsó mondattal maximálisan egyetértek

-
Valóban.
Kezdek megtérülni. 
Fiji vs Tongánál ez érdekes, skálázódás vizsgálatára: 380X OC (Fury X / 2 szinte azonos órajelen)
Felbontás: 2160p 1440p 1080p
GM206 vs GM204 : +107%, +98%, +97%
GM204 vs GM200 : +36%, +33%, +27%
Tonga vs Fiji : +87%, +81%, +68%A Maxwell remekül skálázódik a GM206-GM204 viszonylatában, persze 1440p-től felfelé nem nagyon van értelme a számoknak, 4K-ban már biztosan limitál a VRAM mennyisége. A Titan X-nél már kemény limit van. De kb ugyanolyan mértékben nyílik az olló, mint a Tonga vs Fiji esetén. Szóval tényleg nem igazán lehet frontendre következtetni ez alapján, inkább architektúrális limit.
Maradt a ROP.
Ami még érdekes, hogy a Pascal esetén az GP106 már nem teljesen fele az GP104-nek, mivel a ROP-oknak csak a 25%-át vágták le, s ezt nagyon meg is hálálja, még az alacsonyabb magórajellel is. Kár, hogy az AMD nem tudott ilyet bejátszani, mert ugye akkor az RX 480-nak 384 bites busz kellett volna, amivel lőttek volna az olcsóságának.Várjuk a wunderdrivert.

-
válasz
lezso6
#33240
üzenetére
A dupla backend a ROP-okat és a memóriát jelenti együtt, és egy tesztből meglehetősen nehéz szétválasztani, melyikből profitált többet a Hawaii.
Ha megduplázod a GPU-t, akkor a 85% feletti teljesítménynövekedés már igen jónak számít. A Titan X a GTX 980-hoz képest 50%-kal nagyobb (setupban is), és azonos órajelek esetén 40-42%-kal tud előzni (ld. itt). Ez nem a setup miatt van, hanem egyrészt valamennyire a platform is belejátszik, hiába van közel teljes VGA-limit, másrészt a kártya "infrastruktúrája" (command processor, belső buszrendszer, stb.) sem bírja minden ponton a dupla feldolgozási sebességet kiszolgálni.
Nem akarom magam ismételgetni, de még egy dolgot tudok ide írni - az kiderült, hogy a Tahitinek nem volt a setup szűk keresztmetszete. Akkor a minden tekintetben duplázott, architektúrálisan javítgatott Fijinek mitől lenne?
-
hanzi169
újonc
Ha már a Tonga-Fiji-Hawaii teljesítmény összehasonlításról volt szó, akkor ezt mint érdekesség itt hagynám.
-
Sávszélben meg nem +25%-ot, hanem +110%-ot (!) kapott a 390 a 380X-hoz képest, lehet arra is következtetni, hogy innen jött a plusz profit, ezt még a DCC sem tudja kompenzálni. A Tongánál biztos, hogy nem a setup a gond, pont ezt vezettem le, ebben egyetértünk. A ROP limit a leggyanúsabb a 32-36 CU-nál, mivel kizártam minden mást, de ezt nem tudom igazolni.
A fő kérdés nem a Tonga limitáló tényezője, hanem a Fiji-é. Az egy dupla Tonga, kivéve a setupot, s szerintem pont utóbbi miat nem skálázódik úgy, ahogy kéne. Egy Hawaii-hoz elég a 4 setup, a Tongához overkill, a Fiji-hez viszont kevés. Persze ettől még a Tongából következően a Fiji ROP limitjének is léteznie kell, de ez irreleváns, mivel a Fiji-nek hoznia kéne egy dupla Tonga sebességét még ROP limittel is.
-
válasz
lezso6
#33231
üzenetére
Ha itt nézed, akkor a 390 gyorsabb 41%-kal a 380X-nél, ebből 3% a core clock, tehát a 25%-kal több ALU/TEX, valamint a dupla backend hozott 38% extra teljesítményt - sokkal többet, mint az ALU-k magukban.
Ráadásul a tesztben az is látszik, hogy a 380X 4%-kal gyorabb a 380-nál, a 14%-kal több ALU/TEX ellenére. Valahol gond van, és a Tongánál az végképp nem lehet a setup.(#33236) namaste: igen, ez jogos, és így már csak a tesszeláció nélküli draw esetben marad értékelhető különbség - ezt meg akár a sávszél-különbség rovására is lehet írni. Szóval akkor about face, ACE-kat dobtam
A Tonga kb. ugyanazzal a tri / clk kapacitással rendelkezik, mint a Hawaii és a Fiji - viszont ez nem nagyon segít rajta a Tahitivel szemben - így a Tahiti nem tűnik setup limitáltnak. Viszont akkor a Fiji, ami majdnem pontosan a Tahiti duplája, mitől lenne az? -
DudeHUN
őstag
válasz
FollowTheORI
#33233
üzenetére
Meg, hogy a Matisse menni fog-e tényleg a jelenlegi AM4 lapokban.
-
-
friss líkek
féloff (mert ebben is van egy kis vega):
-
Akkor már nézzük ezt a grafikont, amin rajta van a Polaris meg a Pascal is. A P10-nél valamivel javult a nem látható háromszögek eldobása, bár messze nem eleget, s a Vegánál ugye ezt akarják új szintre vinni, amivel a teljes feldolgozás terén spórolni tudnak.
Érdekes a Tahiti és a Tonga viszonya, utóbbi elég overkill frontendet kapott, azaz csak hányja a háromszögeket, de nem tudott egy millimétert sem előrelépni valós teljesítményben. Így a Polarisnak se kéne tudnia teljesen kihasználni ezt a frontendet, leginkább az órajel segít rajta, s értelmes felbontáson nem képes profitálni a több CU-ból a vágott verzióhoz képest, aminél ráadásul még a sávszél is jóval kisebb. Tehát a Polaris alapvetően ROP limitált kell hogy legyen, s ebből következően valószínűleg a Tahiti és a Tonga is.
A Hawaii +37.5% CU-jához van dupla backend, közel gyorsul is a CU-knak megfelelő mértékkel (lásd 280X vs 290X). De nem többet. Tehát akkor mégsincs ROP limit a 32-36 CU-s GPU-knál? Hisz úgy egyértelműen többet kellett volna gyorsulnia a 290X-nek, de PH, TPU, HW.fr tesztek alapján ez nincs így. A 390-et is behozva a játékba a Hawaii ugyan meghálálja a plusz sávszélt, de elég minimális mértékben, szóval ez nem tűnik limitáló tényezőnek.
A Fiji +100% CU-t hoz, ami overkill. A teljesértékű Tongához képest dupla teljesítményt kéne hoznia, de ebből kb 70-80% lett, hiába van körítésnek dupla ROP és orbitális memória sávszél. A vágott verzió azonos órajelen elhanyagolhatóan lassabb, szóval a CU-k nincsenek kihasználva. A frontendet tudom így oknak felhozni, mivel az nem változott a Tonga óta.
Hol a hiba?

-
válasz
namaste
#33228
üzenetére
Ez elméletben jól hangzik, viszont akkor mi magyarázza a Tonga és a Hawaii / Fiji közötti különbséget?
(#33229) lezso6: az elméleti 4-6 tri / clk csak az egyik része a sztorinak. Hasonlítsd össze a fenti linken a GM204-et és a Hawaii-t - rendes rajzolásnál a reject durván magasabb a GeF esetén, tesszeláció mellett meg mind a rajzolás, mind a reject. Ha ezeken a területeken sokat javít a Vega, akkor egy kicsit tisztább lesz a kép.
-
válasz
namaste
#33228
üzenetére
Na, szerintem itt van a kutya elásva. ACE-ből van elég, sőt a GCN4 óta a 8 ACE felállásról 4 ACE + 2 HWS-re álltak át. Azaz compute rész vezérlésével nincs gond, s igen, az AMD-nek a compute shadereket kéne ezerrel propagálni, mivel azok megkerülik a ROP-okat.
Ami problémának tűnik, hogy már elég sok ideje a közép és felső kategóriánál 4 shader tömb van, azaz a Tonga, Fiji, P10, V10 ebből a szempontból egyforma, a Hawaii óta nem nyúltak hozzá ehhez a felépítéshez. Najó a P10 meg V10 közvetetten próbált javítani, de erről később.
Ugyanúgy 8-9 illetve 16 CU-t kell etetni egy shader tömbön belül és egy geometria feldolgozó van rájuk. Lehetséges, hogy a Fury és a V10 esetén nagyon jót tett volna, ha 4 helyett 6 vagy 8 tömbbe szervezik a CU-kat, csak ezt nem tehetik meg csak úgy.
Itt jön a képbe a Vega, ami már ezen a szinten hoz újításokat: ott az NGG, ami hozza a primitive shadert, s ettől elvileg elég sokat lehet várni, mert a Vega alap 4 tri / clk sebességét többszörösére emelheti. Összevetésként a GM204 / GP104 is 4 tri / clk, a GM200 / GP102 6 tri / clk sebességet tud, s persze Nv oldalon jóval magasabbak az órajelek. A másik meg ugye a DSBR.
Alapvetően szerintem az a probléma, hogy az GCN hiába nagyon ütős compute terén, egyszerűen nem tudnak hatékony körítést csinálni hozzá grafikai feladatokra.
-
namaste
tag
válasz
lezso6
#33206
üzenetére
Tudták mi a gond, ezért az asynchronous compute irányába mozdultak, így munkára lehet fogni a kihasználatlan ALU-kat és meg lehet kerülni a ROP-okat.
(#33210) gbors
Az ACE a compute feladatokat ütemezi, a Shader Engine-ben van a Geometry Processor ami a primitíveket dolgozza fel. -
-
Igen, ez természetesen így van. Vagyis a Vegában még kellenek feature.ök, hogy egyáltalán annyira kihasználtak legyenek a ROP-jai, mint a Fijiben, ahol amúgy szintén gond a ROP teljesítmény. Hm?

(#33225) Z10N: felezett chipnél kb. ugyanazok a problémák. Szerintem hülyeség lenne 1db HBM2 stackkel szállítani őket, gDDR5-tel vagy gDDR5X-szel és 256-bites busszal kényelmesen lehet ugyanazt a sávszélt hozni.
-
Z10N
veterán
Es mi a helyzet a Vega28/32-vel: 28/32cu, 1024bit, valoszinuleg felezett rop 32. A ujitasoknak sok vagy keves lesz a backend? Ha ugye 1600-n fognak jarni akkor 204,8GB/s. Ennel a 470-nek is tobb all a rendelkezesere.
Nagyon kell majd az a csoda driver, hogy az 570/580-t le tudja valtani teljesitmenyben. Kulonben megint az egekbe emelik az orajelet es a feszultseget. Arban pedig biztos nem lesz $169/199 a hbm2 miatt. (Marad a P10).
-
válasz
lezso6
#33221
üzenetére
Nem tudok már a lentieken túl további érveket, bizonyíték-láncokat hozni - egyértelmű bizonyíték meg azért nincs, mert nem tudok olyan azonos architektúrán ülő két GCN kártyát, ahol csak a ROP-ok számában van jelentős diff. Ha egy ilyet felkutatsz, az segít előremozdulni

A Polarisban a 64 ROP a sávszélesség miatt lett volna overkill, ahogy le is vezetted - szerintem 10-15% extra teljesítményt úgy is hoztak volna, azt viszont nem tudom, mennyi tranyóba kerültek volna, és hogy befolyásolják a fogyasztást, merthogy azokat aligha lehet kihasználatlanság esetén power gate-elni.
Okosítani meg mit tudnának még rajtuk? Az összes 32-bites színformátumot 1 op / clk sebességgel tudják, blending mellett is. Szerintem a nyers sebesség a gondjuk, elsősorban az INT8 / FP10 / FP16 vonalon blending nélkül, az meg órajel x darabszám. -
HSM
félisten
Oké, csak egy pillanatra álljunk meg!
"a Fiji esetében is azt mondták, hogy csutkára vannak hajtva a ROP-ok"Tehát, 64 ROP, 1Ghz órajel, és volt alá 512GB/s sávszélesség, és ezen elvileg csontra ki volt hajtva. A Vega kapásból durván másfélszeres órajelen jár, tehát durván másfélszeres (elméleti) ROP sebesség alá van mindössze 484GB/s. Ez így nem az igazi, erős a gyanúm, hogy itt komoly sávszélesség limit lehet, pláne, hogy ugye a csip többi része is gyorsabb, jobban terheli az adatbuszt. Tehát, ismét oda lyukadtunk ki, hogy nem lenne értelme több ROP-nak, mert az alá kéne a nagyobb sávszélesség. Viszont az okosságokkal így csontra kihajtható lehet a csip, ami gazdasági szempontból nem rossz. Gondolom, nem kicsit dobta volna meg a költségeket, ha több HBM2 kocka kellett volna...
-
Nekem még mindig rohadt furán hangzik a backend a gyengeség annak tudatában, hogy az AMD pedig már GCN4 óta a frontendet heggeszti egyre okosabbra, s azzal akarja elérni a csodát.
Miért nem tettek 64 ROP-ot az RX 480-ba, ha ez ennyire kézenfekvő +20-30% teljesítményért? Mondjuk a kivitelezés az kérdéses, hogy a ROP-ok mit szólnak ahhoz, ha felezett sávszélt kapnak. Egy 512 bites vagy ne adj isten HBM-es Polaris meg nem kicsit verébre ágyú lenne. Ezzel lehet meg is válaszoltam magamnak a kérdést.

S akkor miért nem a ROP-ok okosítására állnak rá? BeleROPpannának?
![;]](//cdn.rios.hu/dl/s/v1.gif)
-
Mind a DCC. mind a DSBR a memória-alrendszerre nehezedő nyomást csökkenti, nem pedig a ROP-okra nehezedőt. Ez persze jár valamennyi javulással pixel throughput terén, de miután már a Fiji esetében is azt mondták, hogy csutkára vannak hajtva a ROP-ok, ez nagyon sok nem lehet. Az nVidia a DSBR-like feature és a DCC bevezetése mellett megduplázta a ROP-okat...
A Hawaii-ban kicsit már tényleg sok volt a ROP, ld. lejjebb. Nem meglepő, hogy lehetett jobban is etetni őket. -
HSM
félisten
"hogy a Vega feature-ök közül egyik sem enyhíti a ROP-okra nehezedő nyomást."
Dehogynem. A Hawaii-hoz képest ott a színtömörítés, ami sávszélességet takarít meg a ROP-oknak, valamint ott a DSBR, ami szintén sávszélességet takarít meg. Plusz elvileg még a HBM pszeudo channel módja sem aktív.
Megnézheted a 290X-->390X sebességviszonyánál, mennyire fontos a ROP-ok alá a megfelelő sávszélesség.
A 290X-ek tempóján már csak a ram időzítés javítása is sokat tudott dobni. 
-
#45185024
törölt tag
-
válasz
Petykemano
#33215
üzenetére
Írtam már korábban is, ezeket a limiteket ne úgy képzeljétek el, hogy ha ROP limit van, akkor 20% ROP emeléssel 20%-ot nő a teljesítmény. Ezek nagyon vegyes limitek, ahol vannak dominánsabb és kevésbé jelentős faktorok. Ha a kevésbé jelentős faktoron javítasz, akkor is nő a teljesítmény, csak nem annyival.
Igen, a felbontás növelésével a ROP-ok szerepe hangsúlyosabbá válik, viszont ezzel szemben csökken a platform és a VGA infrastruktúra limitáció is. Nézd meg itt - a Fury X az MSI 390X-hez képest +5%-ot gyorsul a WQHD -> 4K váltáskor, viszont ugyanez történik a 980 és a Titan X között is, holott a TX szimplán a 980 1.5-szerese, nem változik semmilyen egyensúly. Ez csak arra indikáció, hogy a Fiji nem csuklik össze a ROP-hiánytól, aminek amúgy az egyik oka, hogy kapott sávszélességet bőven, és az addig jellemzőtől jobb a ROP-ok utilizációja. De egy idő után 1 pixel / clk az 1 pixel / clk.
(#33216) lezso6: a Hawaii-Polaris összevetés nagyon trükkös. Mondjuk legyen az RX580 és a 390X teljesítménye egyenlő. Az 580 tudása 110% ALU + TEX és 66% backend. Az elsőből jön átlag 5% előny, a másodikból 15-20% hátrány, azaz 10-15% hátránynál tartunk. Ezt viszont kb. kompenzálja az a 10-12% architektúrás előrelépés, ami a Hawaii és a Polaris között történt. Ill. szerintem a Hawaii cca. 56 ROP-pal lenne teljesen kiegyensúlyozott, ez még egy kicsit torzít. Egyszóval a Polaris hozza, amit a számok szerint hoznia kell, és a ROP kevés

A Vega teljesítményét addig felesleges mélyebben elemezni, amíg félig emulációs üzemmódban megy, mert teljesen természetellenes limitációk is lehetnek benne. Ami miatt továbbra is a ROP-okon lovagolok, az az, hogy a Vega feature-ök közül egyik sem enyhíti a ROP-okra nehezedő nyomást.
-
Nekünk tudatos vásárlóknak valóban nem jó, hogy nincs folyamatos előrelépés, de az átlag vásárló nem tendenciák alapján választ. Bár igazából én sem. Én nem tartanám jó vásárnak akkor sem a Vegát, ha folyamatosan javul. Majd ha kész, és egyértelműen lehagyja az 1080-at, akkor mondható el, hogy Vega ajánlott, mint játékos VGA.
A GCN 1-2 esetén ez alapján tényleg van ott ROP limit. De szerintem a közvetlen elődhöz hasonlítva kell keresni a V10 problémájának forrását. A P10 feleannyi ROP-pal és kevesebb CU-val hozza ugyanazt, mint a Hawaii, s a magasabb órajel ezt önmagában nem magyarázza meg. Szóval nem kevés az a ROP.
A V10 pedig már dupla annyi ROP-ot tartalmaz a P10-hez képest, s a CU-k száma is közel ennyivel több, viszont a frontend (látszólag, az inaktív feature-ök miatt) maradt ahogy volt. És a Vega még magasabb órajelt is kapott, mégsem akkora a különbség a P10-hez képest, mint a CU-k száma alapján kéne, főleg úgy tekintve rá, mintha ROP limites lenne, mert akkor a V10-nek legalább a P10 dupláját kéne hogy hozza. Ebből csak arra tudok következtetni, hogy a frontend kevés, s ezen a csodadriver fog javítani.
-
Petykemano
veterán
A ROP-nak több munkája van a felbontás növekedésével?
Az megfigyelhető volt a Fiji esetén, hogy nagyobb felbontások esetén reletíve jobban teljesített. Ennek okaként NTG azt nevezte meg hogy a frontend gyér és a compute erős. Kisebb és nagyobb felbontás esetén a frontendnek ugyanannyi dolga van, itt főleg a geometriára hegyezte ki a hangsúlyt. Ellenben a képpontok számolásánál nagyobb felbontás esetén már van haszna a több shadernek.
Ha a ROP munkája több magasabb felbontás esetén, akkor nem igazán lehet a ROP a limit, nem? -
#45185024
törölt tag
Mivel Guru 3D 2 hétig nem kapott Asustól drivert ÚJRA kirakta a múltkori tesztjét!
Egy kis prológussal, szóval marad a 104 Fokos VRM hőmérséklet ! -
HSM
félisten
Durva, hogy tényleg ennyire megfaragták a 390X-et. Mikor leváltottam a 280X-em egy 290-re, inkább tippeltem volna 25%-ra az érzékelhető ugrást....

Mondjuk az is igaz, hogy 7970-est írtál, és azon még lassabb ramok voltak, mint a 280X-en, cserébe még a 290 is lassabb, mint a 390X, érthető a nagyobb űr.
Igen, jó a teszt, akkor nem a setupon múlt.
Viszont ami érdekes, néhol a nagyobb sávszél hozott nagyon szépen a Tahitinek, néhol viszont azért az erősebb setup is villantott a Tonga-ban. -
Az arch rajzok szerint 4x annyi ACE van benne, ami amúgy kb. duplaannyi háromszöget jelent, és itt látható a 60%. Itt pedig az látszik, hogy mennyit ér a Tonga 2x annyi ACE-je a Tahiti-vel szemben, miközben a háromszög-teljesítmény 60%+-szal nőtt.
-
HSM
félisten
"a 390X közel 60%-kal gyorsabb a 7970-nél"
Szerintem ez egy kicit túl idealista szám. Viszont itt a frontend is duplázódott, a praktikus triangle setup amennyire tudom, a Hawaii 4 motorjával kb. a bő másfélszerese a Tahiti kétmotorosának.
Szerintem amúgy a sávszél fogyott el alóluk, azért se lett volna nagy értelme többet belerakni. És én ezért látok fantáziát abban, hogy a DSBR-el egyfajta tile-rendszer felé mozduljanak, amivel sávszélességet lehetne megtakarítani, ami a feltevésem szerint azonnal ROP sebességet hozna.
-
válasz
lezso6
#33209
üzenetére
Aki annyira gipsz, hogy nem figyeli a híreket, annak tök mindegy, mekkora az upgrade. Itt alapvetően azokat a vásárlókat veszti az AMD, akik hajlanak az AMD vásárlásra, de feladják, mert aaaaaannnnnnyyyiraaaaaa lassan történik valami.
ROP : önmagában nem következik, de nekem ez a legjobb tippem, mert minden más nagyobb területet ki lehet sorban zárni. Sávszél esetében a Pitcairn - Tahiti páros cáfol, a frontendet meg azért nem tartom általánosan valószínűnek, mert a Tahiti 2 ACE-je után a Hawaii-ban 8 van. Ha a chip infrastruktúrája gyenge, és ez látszik a Pitcairn és a Tahiti viszonyán, akkor a Hawaii sem tudott volna akkorát ugrani a Tahiti-hez képest - a 390X közel 60%-kal gyorsabb a 7970-nél, pedig csak 37.5%-kal több benne az ALU és 1/3-ával több a mem sávszél. Szóval, ha nem ROP, akkor mi?
-
Gipsz Jakab nem bizonytalan, csak azt látja, hogy a Vega nem hozza azt amit kéne. Ígyis-úgyis megveszi a zöldet, Ha a pirosak sok kicsit fejlesztenek, az kevés inger sokszor, nem fog eljutni Jakabhoz. De ha egyszerre sokat, akkor tele lesz a net grafikonokkal, s talán eljut Jakabhoz is, hogy csoda történt az AMD-nél. Már ha tényleg lesz csoda.

Ja, hogy a skálázhatóság nem az igazi, s ugyanannyi ROP van a Pitcairnben és a Tahitiben is, s mégse 100% a különbség, ahogy a Hawaii és a Fiji esetében sincs akkora ugrás, mint kéne lennie a teraflopsok* alapján. De ebből nem következik az, hogy a ROP kevés.
* wtf, többesszám többesszáma

-
válasz
lezso6
#33206
üzenetére
... és amíg nem jön az egy nagy, addig folyamatosan nő a bizonytalanság azzal kapcsolatban, hogy mi jön egyáltalán, és az emberek megveszik a zöldséget.
Bűzlik vagy sem, hasonlítsd össze a Hawaii-t a Fijivel, vagy a Pitcairnt a Tahitivel. A kevés ROP régi gond az AMD-nél, már a Cayman is ezzel szenvedett, és valamiért azóta sem változtattak rajta. Nyilván nem azért, mert nem vették észre, lehet egy vagy több limitáció a háttérben, de ettől ez még probléma marad. -
A kis változások senkit sem érdekelnek. Ha egyszerre jön az egész egy patchként az marketing szempontból sokkal jobb, jóval drasztikusabb a változás.
Nekem bűzlik az vélemény, hogy backend lenne kevés. Oké, hogy régóta ugyanannyi ROP van, de ezek képessége nem azonos, főleg egy NV-hez mérve. Meg hát elég hülyék, ha ezt a limitációt évek alatt nem vették észre, ráadásul most a frontendet erősítik, ami eszerint csak egy pofon a szarnak.
-
válasz
Petykemano
#33204
üzenetére
Raja eltávja nekem leginkább arra utal, hogy ő fogja elvinni a balhét az elmúlt 20 év egyik legelbénázottabb VGA-launch-a miatt.
Amit még nem tudunk, az az, hog az érkező csodadriverben várt funkciók közül mennyi a vaporware és mennyi a tényleges érték. Nem jó jel, hogy nem ütemezetten jönnek a bekapcsolások, hanem egyben - éppenséggel lehet, hogy van olyan műszaki alapja, ami miatt több mindent egyszerre kell hozni, de mindenképpen bizalomgerjesztőbb lenne, ha minden driver release-ben bekapcsolnának valamit.
Az ALU-k számával kapcsolatban kétféle nézetet látok. Az egyik szerint a Frontend gyenge a GCN-ben, a másik szerint a kevés ROP. Szerintem az utóbbi, de bizonyítani nehéz. A tervezett újítások a FE-n segítenek, viszont a ROP-ok hiányát csak jobban kihangsúlyozzák. Szóval erős a gyanúm, hogy ha meglesz a fullos Vega driver, a közeli jövőben akkor sem lesz túl nagy differencia egy 2048 és egy 2304 ALU-s variáns között. -
Petykemano
veterán
válasz
#45185024
#33203
üzenetére
Raja eltávja jelentheti az ellenkezőjét is: nincs fontosabb projekt, ami ne lenne sínen és/vagy amihez ne a kijelölt úton elkészítendő driver lenne szükséges. Ha csoda, ha nem csoda, a primitive shader a teljes Vega vonalat érinti. És ha az "utóbbi", vagyis a VEGA11 hátrányait az órajel lesz hivatott kompenzálni a P10-hez képest, akkor az nekik (a driveres csapatnak) lehet, hogy tökjó, hogy nem olyan sok irányba optimaizálni, de Téged mi fog rávenni, hogy inkább azt vedd meg? (Na persze, az, hogy a P10 már nem kapható és valószínűeg nem is gyártják)
-
#45185024
törölt tag
válasz
Petykemano
#33202
üzenetére
Utóbbi.
Raja távozásának indoklása ezt támassza alá, nincs fontosabb projekt amihez drivert kell már írni.
Decemberi start akkor lehet V11-el , ha minimalizálja a teendőket az AMD.
Aztán meglátjuk mit tud az a híres High Bandwith Cache Controller a 4 Gigával végre. Mert kapszaicin óta se volt újra ilyen teszt, pedig most már lehetne nézni mindennel... -
Petykemano
veterán
A polaris a VI-hez képest 7% "Ipc" többlettel bír és ezen kívül a 32 helyett 28 CU 12.5%-kal kevesebb feldolgozót jelent. Aztán hogy ez gond-e egy általában compute nehéz architektúra esetén az kérdéses, mert láttuk, hogy a vega64 se tud többet azonos órajelen, mint a vega56.
Számszerűleg mindenesetre eseket a differenciákat a 20 max 25%-kal magasabb órajel kompenzálhatja csak, ami nem teszi így egyből elavulttá a polarist.
Az amd ilyet nem szokott csinálni. Utoljára a tongával váltotta a tahitit úgy, hogy érzékelhető különbséget nem hozott.
Tehát vagy a csodadriver csoda driver.
Vagy még az lehet, hogy belátták, hogy össességében jobban járnak, ha a régebbi architektúrákat nyugdíjba küldhetik és nem kell egyszerre 3-4 régi és új architektúrát is támogatni a driverben. Ez üdvözlendő. -
válasz
Petykemano
#33200
üzenetére
Ráadásul 36-32 helyett 32-28 a CU szám.
... ami pl. az RX570 és az RX480 viszonyát elnézve majdnem mindegy.
Új hozzászólás Aktív témák
A topikban az OFF és minden egyéb, nem a témához kapcsolódó hozzászólás gyártása TILOS!
MIELŐTT LINKELNÉL VAGY KÉRDEZNÉL, MINDIG OLVASS KICSIT VISSZA!!
A topik témája:
Az AMD éppen érkező, vagy jövőbeni új grafikus processzorainak kivesézése, lehetőleg minél inkább szakmai keretek között maradva. Architektúra, esélylatolgatás, érdekességek, spekulációk, stb.
- 196 - Lenovo Legion Pro 5 (16IAX10) - Intel Core U7 255HX, RTX 5070 (ELKELT)
- Samsung Galaxy S23 Ultra 256GB, Kártyafüggetlen, 1 Év Garanciával
- HIBÁTLAN iPhone 13 128GB Green-1 ÉV GARANCIA - Kártyafüggetlen, MS4347
- Tablet felvásárlás! Samsung Galaxy Tab S10+, Samsung Galaxy Tab S10 Ultra, Samsung Galaxy Tab S10 FE
- ÁRGARANCIA!Épített KomPhone i5 12400F 32/64GB RAM RTX 5070 12GB GAMER PC termékbeszámítással
Állásajánlatok
Cég: Laptopműhely Bt.
Város: Budapest

![;]](http://cdn.rios.hu/dl/s/v1.gif)
Mikro és giga lag-okkal megspékelve, mint a bf1-ben.
Valami pihent agyu kitalalta, hogy ezt a titulust aggasztja az AMD driverekre es azota ez a menozes merteke
Oke... 







A plusz ROP-ok valamennyit biztosan érnek, de ez limitált, mert raszterműveletben csak 32 / clk a GP106.




