-
Fototrend
A legtöbb kérdésre (igen, talán arra is amit éppen feltenni készülsz) már jó eséllyel megtalálható a válasz valahol a topikban. Mielőtt írnál, lapozz vagy tekerj kicsit visszább, és/vagy használd bátran a keresőt a kérdésed kulcsszavaival!
Új hozzászólás Aktív témák
-
sayinpety
tag
A fine-grain async task scheduling vagy async compute PCn nem konnyu. Mantle/Vulkan/Direct3D12 alkalmas, am egyik API sem irja le a GPU IP es ASIC reakciojat. Csak az xBox One/PS4 konnyen tervezheto fix hardware, reszletesen dokumentalt ASIC, kiszamithato reakciok, erre megeri a fine-grain async task scheduling. PCn nem mindig. Keves mai enginet terveztek compute-ra. Sajatunk ~50 compute es ~7000 graphics pipelinet futtat. Tudtommal hasonlo mas engine is. Keves a compute pipeline, hogy megerje foglalkozni a fine-grain async task schedulinggel. Sajat enginemet ismerem, async tiled light culling compute lehetseges shadow map mellett, am csak +3%. Tiled light culling nem sok munka, csak 0.3-0.5 ms. GPU compute particles jobb lehetoseg +5-6%.
Next-gen engine sokkal jobb lesz. Prototype mar fut. ~3000 compute es ~5000 graphics pipeline. Sokkal tobb lehetoseg. Csak explicit es low-level APIhoz. Hibas tesselation es hull/domain/geometry shader stagek kidobva. Csak a hatekonysagot rontjak. Helyukon compute pipeline. Fine-grain async task scheduling erosen hasznalva. PS4en hasonlo complex test scene uj enginen 2x gyorsabb a reginel. Optimalizalas utan meglesz a 3x. Raster efficiency vegig 90% avg. Regi enginet a tessellation sokszor 50% ala vitte. Az async compute tessellation sokkal jobb mint a fixed-function tessellation!
PCn a fine-grain async task schedulinggel az R9-290Xem orajele sosem eri el az 1 GHzet az async compute test sceneben. Atlag 880-890 MHz. Minimum 781 MHz. Regebbi HD 7970 rosszabb, nagyobb az orajel valtozasa. Talan regebbi Powertune miatt? A GTX 780/GTX 980 ma meg nem jol mukodik. Alig gyorsulnak a Geforceok, am az osszes nVidia/Intel GPU IP kulsos PC performance engineering team dolga. A core team ezzel nem foglalkozik. Sajnos a kiado csak a GCN IPk optimalizalasat finanszirozza. A tobbi µarch befektetesre nem ajanlott, nem epul rajuk elterjedt console. A Shield console jo otlet. Ha elterjed es ot evig forgalomban marad, talan Maxwellre is kapnank kiadoi finanszirozast.
-
sayinpety
tag
Az alacsony frequency variance erdekeben en specialis R9-290Xet hasznalok. +35%-os Powertune limitje van. Egyedi developer sample. Nekem szuksegem van stabil orajelre. Az algoritmus gyorsulasat kell latnom. A CodeXL szerint TDP limitbe utkozok. A homerseklet 90 °C. Stabilan tartja a huto, am hangos. Retail ASIC rosszabb lehet az enyemnel, am jobb hutovel.
-
sayinpety
tag
Vulkan, Mantle, GNM, Direct3D12 mono, Direct3D 12, Metal
-
sayinpety
tag
válasz stratova #11801 üzenetére
Magambol kiindulva nem erdekelne egy AMD deferred context implementation. Legalabb 4 honap IHV specificus finomhangolast igenyel, sokkal olcsobb es gyorsabb beepiteni a Mantle APIt. Hatasa is jobb. Nem latom a deferred context letjogosultsagat a Mantle mellett. Nem vagyok a sajat penzem es idom ellensege.
-
sayinpety
tag
válasz Menthirist #12524 üzenetére
Egyszerusitve
Rasterizationnel pixel kozepet kell fedni a haromszoggel. Conservative rasterizationnel eleg barhol erinteni a pixelt.
Raster Order Views UAV ordering. Lehetove teszi OITt alacsony memory footprinttel. A Mantle image load/store mutex atdolgozva. A Mantle megoldas nem biztonsagos LDS virtualization nelkul.
-
sayinpety
tag
Driver nincs kesz. Ket hetre elmentem nyaralni. Mire visszajottem +80% performance vart. Kiadas elott ennyi nem jon. Kodhoz nem nyultam, csak driver performance. Am legalabb gyors. Superheavy scenario (dont-execute-before-2018 :-D ) engine tesztemen az elso GPU average 39 msmal. Mas GPU harom szamjegyet tud. Velemenyem szerint meg gyenge a shader complier, rossz hatasfoku. Meg nincs VLW talan? ...
-
sayinpety
tag
A legtobbet a fogyasztason a draw-stream binning rasterizer segit. Vegara nem mondhatok semmit, am ha Polaris megkapna harmadaval kevesebbet fogyasztana. Jobb akkor eltavolitani a szuksegtelen szamitast, amig nem szamolta ki a hardware. :-)
-
sayinpety
tag
A GCN Bollat az Xbox One/PS4 Bollat masolata. Nagyon konnyu tamogatni. Sokszor code change sem kell, egy source-to-source compiler eleg. Az Maxwell/Pascal Ballot nagyon mas, nem jol mappelheto ra a console optimalizalas. Amig Nv nem fizet, addig nem eri meg ra portolni. A Volta Bollatot mar konnyu tamogatni PSSL sourcebol.
Új hozzászólás Aktív témák
A topikban az OFF és minden egyéb, nem a témához kapcsolódó hozzászólás gyártása TILOS!
MIELŐTT LINKELNÉL VAGY KÉRDEZNÉL, MINDIG OLVASS KICSIT VISSZA!!
A topik témája:
Az AMD éppen érkező, vagy jövőbeni új grafikus processzorainak kivesézése, lehetőleg minél inkább szakmai keretek között maradva. Architektúra, esélylatolgatás, érdekességek, spekulációk, stb.
- Telekom otthoni szolgáltatások (TV, internet, telefon)
- Yettel topik
- Drágább lett a Pixel 8a
- A fociról könnyedén, egy baráti társaságban
- Xiaomi Mi Box androidos médialejátszó 4K és HDR támogatással
- Windows 10
- Kerékpárosok, bringások ide!
- bb0t: Gyilkos szénhidrátok, avagy hogyan fogytam önsanyargatás nélkül 16 kg-ot
- Anime filmek és sorozatok
- Xbox Series X|S
- További aktív témák...
Állásajánlatok
Cég: Promenade Publishing House Kft.
Város: Budapest
Cég: Ozeki Kft.
Város: Debrecen