Keresés: - AMD GPU-k jövője - amit tudni vélünk

LOGOUT témák

PROHARDVER! témák

Mobilarena témák

IT café témák

GAMEPOD témák

Keresés

Téma összefoglaló

Utoljára frissítve: 2024-08-23 16:13

Fototrend

A legtöbb kérdésre (igen, talán arra is amit éppen feltenni készülsz) már jó eséllyel megtalálható a válasz valahol a topikban. Mielőtt írnál, lapozz vagy tekerj kicsit visszább, és/vagy használd bátran a keresőt a kérdésed kulcsszavaival!

Új hozzászólás Aktív témák

#37419 lezso6 HÁZIGAZDA Petykemano #37417

Új Válasz 2018-11-10 10:10:08 #37419
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

lezso6

HÁZIGAZDA

LOGOUT blog

válasz Petykemano #37417 üzenetére

Egyszerű a helyzet.
Az NV-nek van Tensor magja. Egy Tensor mag az 64 db FMAC ALU, ami órajelenként 16 db 16 bites dot productot tud csinálni, azaz órajelenként egy 4x4 mátrixszorzást. Az FMAC működéséből következik az, hogy a mátrix-szorzás eredményéhez bónuszként hozzá lehet adni egy másik mátrixot is, bár ez nem tudom hasznos-e, de ha már van, akkor ki lehet használni. NV-nél egy Tensor magra (64 FMAC ALU) jut 8 sima FP32 ALU. Innen jön a 8x szorzó.
AMD inkább magát a dot product támogatását építette be a SIMD-ekbe. Így a mátrix-szorzás máris gyorsabb, de egy Tensor magnyi teljesítményt egy fél CU tud csak megcsinálni, azaz 2 SIMD (32 ALU), tehát GCN-es megoldás még mindig 4x lassabb.
Elvileg az AMD hoz majd mátrix-szorzást is a Navi-ban. Hogy dedikált hardver lesz-e vagy a CU-k fogják támogatni, azt nem tudom. De a lényeg, hogy ezzel 4x a sebességnövekedés lenne mátrixszorzásban.
Amiről Abu szokott beszélni az az NV dot product támogatásának hiánya. Maga a Tensor nem képes önmagában dot productot számolni, míg a Vega 20 igen. Ugye dot product = vektorok skaláris szorzata. De hogy a mátrix szorzáson kívül hol lehetne hasznosítani a dot productot, arról fogalmam sincs.
Egyébként a Turing erre az Volta-féle INT8 / INT4 lassúságra már válaszolt, mert a Tensor magok ilyennel is tudnak dolgozni, ebben az AMD-nél 4x gyorsabbak mátrixszorzásban. A Volta ténylegesen lassú INT8-ban, mivel a Tensor magjai csak FP16-ot támogatnak.

Új hozzászólás Aktív témák

Téma tudnivalók

A topikban az OFF és minden egyéb, nem a témához kapcsolódó hozzászólás gyártása TILOS!

MIELŐTT LINKELNÉL VAGY KÉRDEZNÉL, MINDIG OLVASS KICSIT VISSZA!!

A topik témája:

Az AMD éppen érkező, vagy jövőbeni új grafikus processzorainak kivesézése, lehetőleg minél inkább szakmai keretek között maradva. Architektúra, esélylatolgatás, érdekességek, spekulációk, stb.

Aktív témák

Új fizetett hirdetések

Üzleti előfizetők hirdetései

Állásajánlatok

Ügyfélszolgálat

Cég: ATW Internet Kft.

Város: Budapest

Részletek

Rendszermérnök

Cég: BroadBit Hungary Kft.

Város: Budakeszi

Részletek

LOGOUT - lépj ki, lépj be!

GAMEPOD - játék fórumok

Mobilarena - mobil fórumok

PROHARDVER! - hardver fórumok

IT café - infotech fórumok

FÁRADT GŐZ - közösségi tér szinte bármiről

Blokkméret

Rendezés

Új hozzászólás Aktív témák

Új hozzászólás Aktív témák

LOGOUT - lépj ki, lépj be!

GAMEPOD - játék fórumok

Mobilarena - mobil fórumok

PROHARDVER! - hardver fórumok

IT café - infotech fórumok

FÁRADT GŐZ - közösségi tér szinte bármiről

Blokkméret

Rendezés

Állásajánlatok

Ügyfélszolgálat

Rendszermérnök