Új hozzászólás Aktív témák

  • Abu85

    HÁZIGAZDA

    válasz Robi BALBOA #4327 üzenetére

    Ugyanaz, mint egy GPU-nál. Amit írtam azt úgy kell érteni, hogy a GPU típusú, vagyis throughput optimized processzornál lényegtelen az, hogy az XDR2-nek nagyobb a késleltetése, mind a GDDR5-nek.
    Az XDR2 előnye, hogy a GDDR5-höz képest kevesebbet fogyaszt, mert a bázisórajel alacsony, de magasabb késleltetése, ami persze egy GPU-nál nem számít. A nagy hátrány, hogy drágább, mind a chip maga, mint pedig a tokozás több csatija miatt az implementálás.

    (#4331) gbors: A 256+ bitet nagyon érdemes kerülni. Nem a mérnöki teljesítmény a probléma, mert 512 bitet is összehoznak, vagy többet is ha kell, de a VGA-piac bevétele drasztikusan csökken (idén a JPR 33%-os mínuszt vár, ami az elmúlt évekhez képest óriási). Az új fejlesztéseknél alapvető elvárás, hogy a mindenhol ahol lehet spórolni lehessen. Ez már nem a nyereség növeléséről szól, hanem a piac fenntartásáról. Egyébként 256 bit mellett is lehet 64 blendinget csinálni. Így is két blokk van egy csatornán, semeddig sem tart négyet rakni rá.
    A fő probléma persze nem itt van. Nézd meg Carmack megatextúrázását. Kurva nagy ötlet, de közben tiszta szopás az egész, mert a dedikált GPU-k nem kezelik az x86 virtuális memóriát. Egyszerűen el kell vándorolni az adatért a rendszermemóriához, és a proci segítségét kell kérni, hogy az meglegyen, majd az információkkal vissza kell térni. Szimplán a PCI Express erre nem alkalmas. Nem az információk mennyiségével van a baj, mert azt simán átviszi egy 4-8 GB/s-os link, de teljes a késleltetés (szoftveres és hardveres oldalról együtt), ami ezzel a procedurális jár, kivégzi a teljesítményt. Carmack szerint a direkt eléréshez képest több 10000-szer lassabb a texture update folyamata, egy pixel frissítésénél. Ez így low, szart sem ér az egész. Nem véletlenül tartja úgy, hogy a Sandy Bridge kamu-IGP-jét is ki lehetne hozni gyorsabbnak. Direkt programozással simán 10000-szer gyorsabb frissítést csinálhat, mert kizárja a szoftveres korlátokat, és a rendszermemória is közvetlenül elérhető, ami kizárja a PCI Express fizikailag kivédhetetlen késleltetését.
    Erre a problémára egyébként az AMD kitalálta a PRT-t, ami az új architektúrában benne is lesz, de a PCI Express késleltetését ez sem zárja ki, csupán közvetlenül eléri az x86 virtuális memóriát. Ezzel a proci kizárható a texture updateből, ami biztos gyorsulást hoz, de a konzolos direkt programozással elérhető szinttől még mindig messze van. Aminek ez a PRT nagyon, de tényleg nagyon fog segíteni, azok a GCN-es IGP-vel rendelkező Fusion APU-k. És akkor egyre inkább arra megyünk, hogy a IGP teljesítménye túró az erős dGPU-hoz képest, de mégis ott van a rendszermemória mellett, és ez a megatextúrázásnál durva előny egy PRT-vel megspékelve. A texture update késleltetése töredék időt igényel. A direkt programozástól ez is gyengébb, de az időigény már nem 100-szoros, 1000-szeres, vagy 10000-szeres.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

Új hozzászólás Aktív témák