-
Fototrend
A legtöbb kérdésre (igen, talán arra is amit éppen feltenni készülsz) már jó eséllyel megtalálható a válasz valahol a topikban. Mielőtt írnál, lapozz vagy tekerj kicsit visszább, és/vagy használd bátran a keresőt a kérdésed kulcsszavaival!
Új hozzászólás Aktív témák
-
Abu85
HÁZIGAZDA
És beszéljük ki, hogy mi mire jó?
Ugye az ESRAM leginkább akkor volt hatékony, ha különböző puffereket nem a RAM-ba mentettél, hanem direkten az ESRAM-ba. A tipikusan memória-intenzív effekteknél ennek nagy haszna van, mert közelebb van, mint a RAM. És akkor tulajdonképpen a 100%-os cache hit mellett az olyan effektek, mint például az SSAO marhára felgyorsultak. Akár alkalmazhattál elborult regiszter- és/vagy LDS-nyomást is, mert nem kellett a tipikus RAM elérési időhöz szabni a konkurens wave-ek számát, hanem lehetett az ESRAM-hoz, és ott már a memóriaelérés átlapolásához elég volt két-három wave is. Ez azért nagyon komoly előny az adott shaderre.
De ez PC-n nem működne, mert per alkalmazás szinten kell optimalizálni. Erre volt is egy saját SDK az Xboxban, amivel tök jó volt, de PC-n senki sem foglalkozna vele.Az L2 cache szimpla növelése igazából egyszerű. Semmi komolyabb indok nincs mögötte a cache hit növelésén kívül. És GPU-król lévén szó az L2 cache hit eléggé fos. Jellemzően 5% alatti, és ha mondjuk sokszorosára növeled az L2-t, akkor is 10-15% alatt marad, mert a GPU egy gyorsítótárakat nagyon szemetelő "állatfaj" a több ezer konkurensen futó szálcsoportjával. De ugye a 10-15% az a duplája-triplája az 5%-nak, tehát ha úgy sem lehet mire költeni a tranyót, akkor miért is ne? Még akkor is, ha nem éppen hatékony ez a fajta brute force koncepció.
Az Infinity Cache az igazából egy másfajta koncepció. Az egy úgynevezett victim cache, aminek a GPU-kban jelenleg semmi más célja nincs, minthogy a tile-alapú leképezést segítette abban, hogy ne kelljen egy csomó esetben elmenni a VRAM-ig. Emiatt az Infinity Cache nem is alapértelmezett része teljes GPU-s cache-rendszernek, és ez azért van így, mert pont az a cél, hogy a GPU ne szemetelje össze.
Ugye egy mai GPU-nál az L2 gyorsítótárak jellemzően a ROP blokkok kliensei. Ez az NV-nél Maxwell óta van így, az AMD-nél a Vega óta, mert a tile-alapú leképezéshez ez az optimális. Ugyanakkor a ROP blokkok úgy kliensei az L2 gyorsítótáraknak, hogy közben a GPU ezt a gyorsítótárat egy rakás más dologra is használja/használhatja. Tehát nem uralkodnak felette a ROP blokkok teljesen, és emiatt az ott tárolt adatok bármikor átdobhatók a VRAM-ba, és ez eléggé tipikus helyzet is. A ROP blokknak sokszor nagyon hasznos lenne, ha a kívánt gyorsítótársort megtalálná az L2-ben, de mivel egy rakás adat cserélődik ott folyamatosan, így elég sokszor kell menni érte a VRAM-ig, és akkor újra behúzza gyorsítótársort az L2-be, amit aztán újra kidob a rendszer, majd ha kellene megint, akkor megint kell menni az adatért a VRAM-ba. És ez úgy nagyjából egy tipikus helyzet, amivel a kívánt adat csak 5-15%-ban van ott az L2-ben, a többi elérés az miss lesz, vagyis menni kell a VRAM-ig.
Az Infinity Cache specifikusan erre a problémára reagál, ugyanis nem része szokásos gyorsítótár-hierarchiának, hanem egy védőhálót képez az L2-ból kidobott, ROP blokkoknak fontos gyorsítótársorok összegyűjtsére. Ezzel tulajdonképpen megelőzi azt a problémát, hogy a GPU-nak a VRAM-ig kelljen menni, ha a ROP blokk által keresett gyorsítótársor hiányozna az L2-ből. És ugye a tipikus nyüzsgés miatt nem is célszerű az L2 kapacitását nagyon növelni, mert a nyüzsgés attól még ott lesz, hogy a gyorsítótár sokkal nagyobb. Szinte minden részegység ír oda valamit, és sok ezer párhuzamosan futó lane mellett ez nem kevés adat ám. Ellenben az Infinity Cache-be a lane-ek nem írnak. Tilos nekik, így nem tudják azt szemetelni. Ez a gyorsítótár csak azt teszi, hogy "felfogja" az L2-ből a nyüzsgés miatt kidobott, de fontos adatokat. És pont azért ér el az AMD pixelszámtól függően 40-70% közötti cache hitet az Infinity Cache-ben, mert magát a nyüzsgést irtotta ki belőle. Nem a kapacitás itt a fontos, hanem a victim cache-sé szeparálás, elvágva a gyorsítótárat attól a több tízezer lane-től, ami alig várja, hogy szétszemetelje az L2-t minden egyes ciklusban.
Új hozzászólás Aktív témák
A topikban az OFF és minden egyéb, nem a témához kapcsolódó hozzászólás gyártása TILOS!
MIELŐTT LINKELNÉL VAGY KÉRDEZNÉL, MINDIG OLVASS KICSIT VISSZA!!
A topik témája:
Az AMD éppen érkező, vagy jövőbeni új grafikus processzorainak kivesézése, lehetőleg minél inkább szakmai keretek között maradva. Architektúra, esélylatolgatás, érdekességek, spekulációk, stb.
- Házi barkács, gányolás, tákolás, megdöbbentő gépek!
- Hobby elektronika
- Milyen SSD-t vegyek?
- Azonnali informatikai kérdések órája
- sziku69: Szólánc.
- sziku69: Fűzzük össze a szavakat :)
- Luck Dragon: Asszociációs játék. :)
- Vicces képek
- Chieftec-Prohardver nyereményjáték
- Poco F6 5G - Turbó Rudi
- További aktív témák...
- Apple iPhone 13 Pro / 128GB / Kártyafüggetlen / 12Hó garancia / Akku : 100%
- Targus DOCK423A - USB-C Dual HDMI 4K HUB - 2 x HDMI (120Hz)
- Honor Magic V3 Black Hajtogatható csúcsmobil, nagy főképernyő + fedlapi kijelző 12/512 GB
- Samsung Galaxy A20e 32GB, Kártyafüggetlen, 1 Év Garanciával
- Bontatlan, Sony PS5 PRO Pro 2TB, lemez mentes verzió
Állásajánlatok
Cég: BroadBit Hungary Kft.
Város: Budakeszi
Cég: PCMENTOR SZERVIZ KFT.
Város: Budapest

