Új hozzászólás Aktív témák
-
#06658560
törölt tag
Én csak arról beszéltem volna, hogy nem lett volna értelmesebb, kompakt összekötése a magoknak, hogy a késleltetést alacsonyabban tartsák? Mert így egyszerre két egység tudja vizsgálni a kérést, hogy adatot kér egy harmadik, úgy meg a drótozás kérdése, mennyinek adják ki. Kisebb egységekben gyors a körbeérés, nagyobbakban meg a mostaninál nem lassabb több mag esetén sem.
Apropó: azt mi alapján lehet eldönteni, melyik megoldás éri meg jobban: az adott egység kér adatot máshonnan, vagy a másik egységnek átadja a sajátját kérés nélkül, s dolgozik tovább más szegmenssel?
-
LordX
veterán
Szerintem viszont pont össze fognak érni - szoftver oldalról a "CPU" és "GPU" mindig is különböző lesz (pont mivel másra való), még akkor is ha egy chipbe lesz (van..) integrálva, viszont mindkét 'szálon' néha-néha bejöhet egy-egy olyan utasítás, ami a másiknak kedvez jobban.
El tudok képzelni egy olyan jövőbeli APU-t, amin a CPU AVX(-szerű) utasításait GCN(-szerű) végrehajtóegységekre ütemeznek, a GPU meg kap pár bitshuffle / integer / akármi utasítást, amit a proci integer egységei hajtanak végre. Ilyen esetben már persze nem lehet azt mondani, hogy ez a rész a CPU az meg a GPU.
-
Abu85
HÁZIGAZDA
válasz
julius666
#18
üzenetére
A minőség az eléggé függ a szoftvertől is. De a GPU-k is mennek felépítésben a procis irányba. A GCN CU már úgy néz ki, mint egy RISC processzor. A CPU-k is mennek egy picit GPU-s irányba pl. AVX2. Összeérni sosem fognak, mert más szempontok alapján kell tervezni őket a hatékony működéshez, de az letagadhatatlan, hogy a logikai felépítésük egyre hasonlóbb.
-
julius666
addikt
Videó kódolásra a rengeteg compute shader nem igazán jó architektúra. A gpukba jelenleg bedrótozott gyorsítok meg energiahatékonyság szempontjából lehet hogy jók, azon túl viszont buták, túl merevek (nem skálázódnak) és minőség terén sem biztos hogy kielégítő amit kitolnak magukból (nyilván felhasználási terület kérdése).
A cikkben tárgyalt cucc viszont nem hangzik rá rossznak.
-
Abu85
HÁZIGAZDA
válasz
#06658560
#16
üzenetére
Az magok önmagukban nem foglalkoznak a másik maggal. Ha kell egy gather, akkor az kikérésre kerül, de a rendszer ezt monitorozza. Ha egy adat ép olyat akar felülírni, amit éppen kér egy másik mag, akkor előbb annak a másik magnak a kérése teljesül, majd aztán felül lesz írva.
Ahogy Andrew Richards megmondta régebben a Larrabee fejlesztésével való tapasztalatai alapján: az x86-os processzormagok nagyon mereven kezelik a memóriaműveleteket és a koherenciát. Ez logikus, mivel amikor az ISA-t tervezték pár évtizeddel ezelőtt abszolút nem is volt belekalkulálva, hogy valaha is 60 mag lesz egymás mellett. Még arra sem gondoltak, hogy kettő lesz. Az Intel azért van ezekre a trükkökre kényszerítve, mert ragaszkodnak az x86-hoz.
Ahogy láthatod az NV és az AMD GPU-it, teljesen más a tervezési norma. Az ISA-t folyamatosan az igényekhez igazítják, mert ez a hatékony működés alapja. A cacheszervezés is elképesztően más. Az Intelnél a Knights Corner egy magon belül tartalmaz egy 32 kB-os utasítás és egy 32 kB-os adat cachet, és a magokhoz tartozik 256 kB L2, ami összesen 32 MB L2 jelen esetben. A GK110 például teljesen más. Ott egy magban van egy 48 kB-os csak olvasható cache, amit kiegészít egy 64 kB-os L1, ami szétosztható háromféleképpen (16/48, 32/32, 48/16), emellett van még Az L2 összesen 1,5 MB. A Tahiti szintén más. Ott egy magban van egy 64 kB-os LDS egy 16 kB-os L1, és négy mag között meg van osztva egy 16 kB-os csak olvasható és egy 32 kB-os utasítás gyorsítótár. Az L2 pedig összesen 768 kB.
Elképesztő a kontraszt, ami az AMD/NVIDIA és az Intel között van. Teljesen más a tervezés iránya. Persze az AMD-nek és az NV-nek könnyebb, mert náluk ott az évtizedes tapasztalat, még ha az AMD ezt az ATI-val vette is. Az Intel most tanulja mit-hogyan-merre. -
#06658560
törölt tag
Ha jól értem amint egy egységnek kell valami a nem saját memóriából, akkor kiküldi mindkét irányba a kérést, amit a szomszédjai megvizsgálnak, majd ha nincs náluk továbbküldik. Egész addig, amíg valaki nem visít, hogy megvan, küldöm. Az vagy mindkét irányba küldi, vagy azon irányba, amerről előbb érkezett neki a kérés, a másik irányba meg egy nulljelet esetleg. Nem érné meg faszerkezetben kivitelezni a kapcsolatokat? A klasszikus tervezzünk kutatóbázis alapon a maximális út rövidebb lenne. Miért nem azt választották?
-
válasz
lionhearted
#14
üzenetére
Hát még neked

Bocsi, de nem hagyhattam ki

-
-
-
onereborn
tag
Egy mezei Sandy Bridge rendszerben is futhat vagy csak xeon cpukkal fog együttműködni.
Ez még sehol sem jött le.Mert az AMD és az nVIDIA a GPGPU számítást nem csak nagyvállalati környezetre fejleszti - természetesen abban a kategóriában több szolgáltatás található, mint egy mezei otthoni számítógépnél.
-
Abu85
HÁZIGAZDA
Nem kell ide csicsa a lényeg látszik.

Inkább az AMD gyűrűse. A HUB-os más. A gyűrűst a magas késleltetés miatt lecserélték. Ez egyébként itt is probléma volt a Knights Ferry-vel. Ezért osztották négy blokkra a rendszert. Bár mindegyik mag elérheti az összes memóriavezérlőt, de törekednek arra, hogy a legközelebbit használják. Mire 25-30 megállón átmegy az adat az 25-30 órajel. Persze ez a négy szál miatt annyira nem nagy gond itt, de majd a Skylake-ben gázos lesz, mert ott a procimagok igen érzékenyek arra, hogy mennyit késik az adat, és ez a gyűrűs busz általános átka.
Azokat nem ismerem, de hasonló lehet, mint a DGEMM. A DGEMM azért terjed, mert az Intel szerint ez a mérvadó. Az AMD és az NV szerint ez csak egy adat, ahogy a többi is, és nem szabad belőle általánosítani.
-
MongolZ
addikt
Az Intel gyakornokai szép kis képeket dobtak össze Paintben az előadást megelőző éjszaka

Nekem egyből az AMD hubos megoldása jutott eszembe a diagramról. Jók a megérzéseim?

Valamiért nem hiszem, hogy az Intel (első körben) komoly alternatíva lehet az AMD és az nV számára. Technikailag. Az üzletpolitikájukat ismerve pedig nagy jövőt jósolok neki.
Egyébként S/C/ZGEMM hatékonyság ismert (C és Z mennyire releváns)?
-
LordX
veterán
Kíváncsi lennék egy GCN - MIC - Kepler összehasonlításra, compute irányból.
-
válasz
lionhearted
#2
üzenetére
Okok, ezért (is) gyorsítókártya

De van egy két dolog, ahol párhuzamos számításokra lehet szükség.
Lesz-e mainstream kategóriában is szerepe, vagy csak nagyvállalati eszközként tekintsünk rá? -
-
Gyorsítókártya lesz, ez rendben, de mit fog tudni gyorsítani?
Új hozzászólás Aktív témák
- Battlefield 6
- Fizetős szoftverek ingyen vagy kedvezményesen
- ASZTALI GÉP / ALKATRÉSZ beárazás
- Kínai és egyéb olcsó órák topikja
- Futárcégek
- Melyik tápegységet vegyem?
- A robotaxik bizony karamboloznak, nincs itt semmi látnivaló!
- Milyen okostelefont vegyek?
- Milyen autót vegyek?
- Becsszó, még mindig készül a Half-Life 3!
- További aktív témák...
- Telefon felvásárlás!! iPhone 11/iPhone 11 Pro/iPhone 11 Pro Max
- BESZÁMÍTÁS! MSI H310M i5 9500 16GB DDR4 120GB SSD 2TB HDD RTX 2060 Super 8GB ÚJ Zalman T4 Plus 600W
- GYÖNYÖRŰ iPhone 13 Pro 256GB Gold-1 ÉV GARANCIA -Kártyafüggetlen, MS3964, 100% Akkumulátor
- Kaspersky, BitDefender, Avast és egyéb vírusírtó licencek a legolcsóbban, egyenesen a gyártóktól!
- GYÖNYÖRŰ iPhone SE 2020 128GB Black -1 ÉV GARANCIA - Kártyafüggetlen, MS3582, 100% Akksi
Állásajánlatok
Cég: Laptopműhely Bt.
Város: Budapest
Cég: PCMENTOR SZERVIZ KFT.
Város: Budapest







