-
Fototrend
A legtöbb kérdésre (igen, talán arra is amit éppen feltenni készülsz) már jó eséllyel megtalálható a válasz valahol a topikban. Mielőtt írnál, lapozz vagy tekerj kicsit visszább, és/vagy használd bátran a keresőt a kérdésed kulcsszavaival!
Új hozzászólás Aktív témák
-
namaste
tag
Fogyasztás-tudás témában több érv elhangzik, amelyek nem valósak:
-általában ha valamely funkcióhoz több tranzisztor kell, de azt valami miatt nem használjuk, akkor az nem fogyaszt jelentősen többet,
-dupla pontosságú számítások többet fogyasztanak. Igen, ha használjuk, de játékokban nem jellemző. A Hawaii hiába rendelkezik több DP számolóval, ha nem használjuk nem fogyaszt,
-UAV csak egy szoftveres absztrakció, a GCN és a Fermi/Kepler/Maxwell is D3D11-ben max 8 UAV-ot használ, ez nem indokolja a többletfogyasztást.
Ami valós érv lehet:
-memória rendszer, belső busz: 512 bites külső memóriabuszhoz és a meghajtásához több vezérlő tranzisztor szükséges, amelyek terhelés alatt folyamatosan működnek,
-több memóriacsip többet fogyaszt (vagy nem, inkább a memória mérete a meghatározó).Még valami a fogyasztáshoz: a Green500-as listát egy AMD FirePro S9150-al (Hawaii) szerelt gép vezeti.
Még egy szempont, ha összehasonlítjuk a Keplert és a Maxwellt a fogyasztás-tudás alapján: a Maxwell többet tud, mégis kevesebbet fogyaszt.
Ha az AMD kihoz egy nagyon alacsony fogyasztású Fijit, akkor az AMD fanoknak lesz fontos a teljesítmény-fogyasztás arány, az NV fanok pedig ...
(#9240) gbors
"priorizált adatutak a crossbarban (ugye ebből fakad a 970-es probléma, de maga az ötlet nagyon jó)"
Szerintem nem jó ötlet, és nem ebből fakad a 970-es problémája. -
namaste
tag
A mobilt ne keverd ide, oda sokkal kisebb belső crossbar kell. K1-ben egy SMX, X1-ben két SMM van (plusz a processzorok, videó dekóder, display driver, egyéb I/O, memóriavezérlő: 2x32 bit).
(#9278) HSM
OK, többet fogyaszt, ha ott van a több DP egység, mintha nem lenne ott. De ez nagyon minimális többletfogyasztás, akkor fogyaszt sokat, ha meg is hajtod azokat.
Össze lehet hasonlítani a 780 és a TITAN játék közbeni fogyasztását a TITAN összes DP-egységének engedélyezése mellett. Mennyivel fogyaszt többet a TITAN bekapcsolt, de nem használt DP számolókkal?
Igen, GTX 780/GK110-re gondoltam. A "többet tud" arra vonatkozik amit Abu a #9233-ban írt, a funkcionális tudásra és nem a nyers erőre (több DP).
Nincs a Maxwellnek HPC változata, még. Lesz majd? Nem tudom.Szerintem nincsenek priorizált adatutak. Semmit se lehet vele nyerni.
-
namaste
tag
Ha az SMM-eknek van kitüntetett ROP/L2/MC egysége, az megbontja az egész rendszer szimmetriáját, főleg az SMM-ek letiltása esetén.
A működés során egy SMM egyforma eséllyel olvashat adatot mindegyik ROP/L2/MC egység felől, ilyen szempontból szimmetrikus.
Meggyőző lenne egy tesztprogram, ami bizonyítaná a priorizált adatutakat.Az NV hétfői válasza hihetően magyarázza a működését, a szombati az valóban mismásolós volt.
-
namaste
tag
A GCN-ben a ROP-ok a Shader Engine-ben, a CU-k mellett vannak és a belső buszra kapcsolódnak. Így a Tahiti 32 ROP és 6x64 bites külső adatbusz párosításában semmi trükk sincs. Az NV csipekben a ROP/L2/MC alkot egy egységet.
Egy HBM modulnak valójában 8 db egymástól teljesen függetlenül működő csatornája van, az 1024 bites adatbusz 8x128 bites.
-
namaste
tag
A Perf/Watt arányból nem lehet az IPC-re következtetni, a Perf/freq arányból lehetne.
A Perf/Watt mutatót mihez hasonlítják? Az R9 285 vagy a Nano az etalon? Nem mindegy.(#20432) Ren Hoek
Grafikánál nincs szoros összefügés, a többi részegység (TEX, ROP) is számít. A számítási feladatok is architektúra és algoritmus függőek.Az AotS GPU bound nem a GPU kihasználtságot mutatja, hanem hogy mennyit vár CPU a GPU-ra. 50%-os érték jelentése: a CPU parancslistákat küld a GPU-nak, van amikor a CPU vár a GPU-ra, van amikor a GPU vár a CPU-ra, ugyanolyan arányban.
-
namaste
tag
-
namaste
tag
válasz Petykemano #26238 üzenetére
Nem hiszem, hogy hátrányba kerülne a kevesebb VRAM miatt, a legalább 8 GB HBM2 mindenre elég, a pro változat kap 16 GB-ot, most is csak a 2-3 GB VRAM-mal vannak akadások az új API-kkal.
Szerintem is első körben csak a pro programok fogják használni az SSD-t/rendszer memóriát és nem lesz teljesen automatikus a másolgatás, bele kell kódolni a programba. -
namaste
tag
Mi az a "keresztkötéses"?
"mert van egy GDS a rendszerben, tehát minimum egy gyűrűs buszt kell használni"
Miért tehát? Mutass már valami hiteles bizonyítékot a gyűrűs buszra, sokszor írtad már, de semmi bizonyítékot nem adtál."A Vega itt sokat nyer, mert már nem gyűrűs buszt használ, hanem egy NoC-ot, vagyis egy lapkán belüli hálózatot."
Ez semmitmondó, a NoC csak ennyit jelent: Network-on-Chip. Semmit nem mond milyen a topológia, milyen a protokoll, milyen alkatrészekből épül fel, csak annyit, hogy hálózat a csipen."több milliószor lassabb"
Erre van valami mérési eredményed?#27845
A variálható wavefront méret a kis háromszögeken futó pixel shadereken is segít.Még mindig kételkedek abban, hogy a fogyasztástöbbletet a plusz funkciók okozzák. Ezek a GPU-nak csak nagyon kis része, viszonylag kevés tranzisztor kell hozzá, ráadásul aktívan nem is használják a programok DX11-ben. Most már van AGS, Vulkan és DX12. Tehát se az áramszivárgásból, se a használatból nem lehet többletfogyasztás.
-
namaste
tag
válasz Petykemano #27924 üzenetére
Ez az "up to 11" poligon elég érdekesen hangzik. Miért nem 8 vagy 12?
"A képernyőt ennek megfelelően 4 részre osztja."
Ez nem így van, ez nagy hülyeség lenne.(#27941) Ren Hoek
A hardverben kevés FP16-os számoló van, csak a P100-ban és a Tegrákban van kétszeres sebességű FP16.(#27944) arabus
A Titan Xp int8 és int16 számításokban gyors, FP16-ban nagyon lassú. -
namaste
tag
Ez elég rejtélyes, rákérdezhetek? Keresztkötés = crossbar?
Majd ha lesz publikus infó, elhiszem.
Infinite Fabric - ez csak egy elnevezés, NoC - ez csak egy rövidítés, semmi konkrétum.
A Global Ordered Append leírásában két függvény van, de egyik sem a sorrendben futtatásról szól, hanem globális atomi számlálók.
Ha van minden cégnek meghajtója, majd teszt is lesz, lehet mérni. -
namaste
tag
Na ugye, az Infinite Fabric az marketing név, van mögötte konkrét tartalom, hogy mi, majd meglátjuk. A NoC ilyesmi, az egy rövidítés, bármit jelenthet.
Az atomi memóriaműveleteket nem magában a memóriában végzik, hanem van dedikált hardver az L2 cache-ben, ami biztosítja a sorrendet. Az olyan feladatok, amelyek nem használnak atomi műveleteket, futhatnak párhuzamosan az atomiakkal, nem feltétlenül áll meg minden.
Azért kell mérés, hogy az olyan kijelentéseket mint "több milliószor lassabb" lehessen ellenőrizni. Korábban azt írtad, hogy ezerszer lassabb. -
namaste
tag
Elbeszélünk egymás mellett. Arról írok, ami az NV hardverben megvan és ezekre kell építeni amikor szoftveresen emulálják. Azt is elfogadom, hogy lassabb lesz, a kérdés: mennyivel?
Mi van, ha az összes sorrendet megtartó shadert egy SMX/SM-en futtatják, az atomi műveleteket a Shared Memory(=LDS) segítségével lekezelik. Még mindig kell emuláció, de se L2, se VRAM hozzáférés nem kell.Kétlem, hogy a sorrend megtartása mellett egy CU-n csak 4 wavefront fusson egyszerre, hiszen ott van a dedikált hardver.
-
namaste
tag
válasz Petykemano #32567 üzenetére
Talán az AVFS nem a fő szabályozó, hanem másodhegedűs és csak vészhelyzetben (pl. leesik a feszültség, magas hőmérséklet) avatkozik be.
-
namaste
tag
válasz lezso6 #33206 üzenetére
Tudták mi a gond, ezért az asynchronous compute irányába mozdultak, így munkára lehet fogni a kihasználatlan ALU-kat és meg lehet kerülni a ROP-okat.
(#33210) gbors
Az ACE a compute feladatokat ütemezi, a Shader Engine-ben van a Geometry Processor ami a primitíveket dolgozza fel. -
-
namaste
tag
válasz Petykemano #35456 üzenetére
Idén jön a Vega Mobile GPU with HBM2, akár videokártyaként is ki lehetne adni.
(#35460) Abu85
A HBM gyártás legtöbb lépése megegyezik a többi DRAM-éval, hasonlóan épülnek fel. Ami több, az TSV-k kialakítása és a vékonyra csiszolás. De a közös gyártási lépéseket ugyanazokon a gépeken lehet elvégezni. -
namaste
tag
Te nem érted a GPU-k működését. Mindent a skalár egységre akarsz fogni, de minden feladatát elvégzi az NV GPU-kban valamelyik másik részegység. Ami nem a CPU.
Az Intel GPU-k utasításvégrehajtás szempontjából jobban hasonlítanak egy sokmagos, sokszálas SMT7 SIMD CPU-ra, mint a többi GPU-ra.A GT 1030 nem az, aminek látszik. Elköveted azt a hibát, hogy egy mérést általánosítasz.
-
namaste
tag
A skalár egység csak tárolja a leírókat, ugyanezt megteszi a constant cache illetve a textúrázó. Az nem egy nagy terhelés, ha esetleg nem egy helyre kell másolni a leírókat.
Gondoltam, hogy nem fogsz konkrétumot írni.
A techreport egy "gyenge" i7-8700K 6 magos processzorral tesztelt, átlag 20 fps-t kaptak. Ha ez a driver miatt lenne, szerinted a sokszálas CPU bekötés miatt, akkor a GTX 1050 se lett volna jobb, pedig az az RX 460-nal egy szinten van átlagban, igaz a frametime nem jól néz ki.
Ugyancsak techreport teszt, a felsőbb kategóriákban a 1060, 1070, 1070 Ti, 1080, 1080 Ti mind a helyükön vannak.
Az ipon tesztjében a kétmagos G4560 és a négymagos 2200G nagyjából egyformán teljesít, mikor melyik a jobb.
Új hozzászólás Aktív témák
A topikban az OFF és minden egyéb, nem a témához kapcsolódó hozzászólás gyártása TILOS!
MIELŐTT LINKELNÉL VAGY KÉRDEZNÉL, MINDIG OLVASS KICSIT VISSZA!!
A topik témája:
Az AMD éppen érkező, vagy jövőbeni új grafikus processzorainak kivesézése, lehetőleg minél inkább szakmai keretek között maradva. Architektúra, esélylatolgatás, érdekességek, spekulációk, stb.
- Újszerű - POWERCOLOR Radeon RX 5500 XT 8GB GDDR6 VGA videókártya
- Sapphire NITRO+ RX 580 8G SE
- ASUS ProArt GeForce RTX 4080 SUPER 16GB GDDR6X OC (ASUS-VC-PRO-RT4080S-O16G) Bontatlan új 3 év gar!
- 10x R5 430 2GB DDR5 egybe (zörgő ventis)
- Legújabb Nvidia Quadro RTX 4000 Ada Generation 20 GB új garis eladó
Állásajánlatok
Cég: Promenade Publishing House Kft.
Város: Budapest
Cég: Ozeki Kft.
Város: Debrecen