Új hozzászólás Aktív témák
-
lenox
veterán
De akkor ha jol ertem a gyorsitokhoz tartozo float feldolgozo egysegekhez mashol sem szamoltal kulon memoriat, szoval ennel sem kellene, vagy akkor a gpus gyorsitoknal is el kellene kezdeni szamolni, hogy az vajon hany mag lehet. Mindenesetre itt processzoronkent (eredetileg amugy ezt irtad, hogy keves a ram per cpu) 32 GB ram van. Nem tudnik kevesnek, Blue Gene 16 GB per cpu.
-
fusionfan
csendes tag
Lehet nem egyformán matekozunk, de ha itt megnézed
http://www.top500.org/system/178764
1.3e6 GB ram jut ~1e7 processzormagra, ez magonként ~0.12 GB.
Tianhe-2-n ez kb 1/3 GB, Titanon 1.3, személyes kedvencemen a K-n pedig ~2. Ha jól emlékszem egyébként a "tényleges" általános cluster preformance tekintetében a K a legjobb. Tofu interconnect zseniális.Én csak azért vagyok érzékeny erre a kérdésre mert amin én dolgozom az sajnos memóriaigényes is, nem csak CPU - annyira hogy sokszor a bottleneck inkább a memory bandwidth; de a nyamvadt Xeon Phi-ken meg elég kicsi a memória. Emiatt amin én dolgozom ott kb 20 GB jut minden magra
-
ukornel
aktív tag
"eredetileg amugy ezt irtad, hogy keves a ram per cpu"
Nem én írtam, hogy kevés a ram per cpu, hanem fusionfan. Én csak belevauvauztam"De akkor ha jol ertem a gyorsitokhoz tartozo float feldolgozo egysegekhez mashol sem szamoltal kulon memoriat"
Az általam beírt listában szerintem csak a Titan és a Tianhe-2 alkalmazott külön gyorsítókat, ha jól tévedek."vagy akkor a gpus gyorsitoknal is el kellene kezdeni szamolni, hogy az vajon hany mag lehet."
Atyagatya... az lenne még csak durva Nyilván nem lenne sok értelme, hiszen az csak egy gyorsító.
A gyorsítókhoz tartozó memória valójában nem része a rendszermemóriának, de mivel valamit azért mégis elárul a rendszer terhelhetőségéről, azt is föltüntettem "+" jelek mögött.
Pl. a Titan architektúrája olyan, hogy egy blade szerverben van négy node, node-onként egy 16 magos Opteron6274 32 GB RAM-mal plusz egy Tesla K20X 6 GB RAM-mal.
Összesen 18.688 node-ban van tehát 299.008 mag 598.016 GB RAM-mal, plusz van 18688 db gyorsítón 112.128 GB RAM. Akár node-onként, akár összesítve nézem az arányokat, egy magra 2 GB RAM jut, plusz a gyorsítóban levő memória 0,375 GB egy magra lenormálva. Ezt jelöltem úgy, hogy 2 + 0,375 GB/mag. A +0,375 GB-ot gondolom csak az adott gyorsító használja, általánosan nem címezhető.[ Szerkesztve ]
-
namaste
tag
válasz shabbarulez #16 üzenetére
A Cell-nél nem csak a PPE tud memóriaműveleteket kezdeményezni, hanem az SPE-k is. Az SPE-k képesek adatot másolni két LS (Local Store) között, illetve az LS és a memória között. Nem sokat lehet tudni SW26010-ről, de valószínűleg hasonlóan működik.
-
#65675776
törölt tag
Nem arról volt szó, hogy a Tianhe-2-ben csak dísznek vannak a Phi-k? Vagy sikerült végre módot találniuk rá, hogy hatékonyan programozzák őket? Mert szép és jó az elméleti maximum, ha a valóságban nem lehet töredékét sem kihasználni. Szóval lehet akármilyen szintetikus tesztet futtatni és az eredményeket promózni, sokat nem számít. A valós erőviszonyokat csak az mutatná meg ha ugyanazt a feladatot leprogramoznák több SC-re is, és mindegyiken lefuttatnák. Persze az meg igencsak sokba kerülne.
-
rudi
nagyúr
válasz #65675776 #55 üzenetére
Meg azt sem lenne rossz tudni, hogy amire használni akarják, arra megfelel-e vagy annyira azért nem. Hogy nincs-e olyan helyzet, hogy a munkások fűnyírót kérnek és motorfűrészt kapnak, aztán amikor reklamálnak, jön az ukáz, hogy kuss, motorfűrészből tudunk qrvanagyot csinálni, azt kaptok.
Resistance Is Futile. You will be assimilated!
-
fusionfan
csendes tag
válasz #65675776 #55 üzenetére
Igen ezt mondtam én is, hogy szép az elvi teljesítmény, de a kihasználás más kérdés. VAN feladat amire tök jó a phi, csak nem mindenre sajnos. Ugyanez szerintem ezzel az új kínai csodával. Persze ha van elég feladat amit le lehet programozni pont erre az architektúrára akkor marha jó mert csodálatos teljesítmény / fogyasztás mutatókat produkál ami ekkora gépeknél fontos.
Egyébként van olyan benchmark ami a "tényleges" cluster teljesítményt nézi, csak nem azt szokták mutogatni mert az vitatható mindenféle oldalról. A flops egy nagyon egzakt szám, csak cserébe nem mond annyit a használhatóságról. -
lenox
veterán
válasz fusionfan #52 üzenetére
260 mag van processzoronkent, 32/260 az kb 0.12 GB, szoval ugyanaz a matek, 32 GB van processzoronkent. Nyilvan a 260 magra nem ugyanugy erdemes feladatot szervezni, mint egy normal 8-16-24 magos processzornal.
#53:
Igaz, nem neztem, ki irta .En ezt ertem, nekem ez az uj proci leginkabb egy 4 normal mag plusz gyorsitonak felel meg, szerintem nem erdemes a specko magokra leosztani a memoriat.
#55 Ha van valos feladatbeli eredmeny, akkor annal jobb, mindenesetre ha ket szintetikus tesztbol az egyikrol lehet tudni, hogy kozelebb all a valos teljesitmenyhez, akkor valoszinuleg nem erdemes csak a masikat figyelembe venni, foleg, ha lehet tudni, hogy az eredmeny eppen ellentetje egymasnak.
-
Reggie0
félisten
A +0,375 GB-ot gondolom csak az adott gyorsító használja, általánosan nem címezhető.
De cimezheto a teljes memoriaja a gyorsitonak a PCIe cimartomanyban(ezert is nem mennek hetkoznapi alaplapokban ezek a kartyak, mar xeon phi is ilyen, kesz szenvedes volt consumer lapon beizzitani). Viszont a savszelessege csak akkora, mint a 16 lanes pcie 3.0-nak, igy a rendszermemoriaval nem osszevetheto. Mondjuk lehet az SSD helyett hasznalni az ideiglenes fajlok tarolasara, mert annal azert gyorsabb.
[ Szerkesztve ]
-
Reggie0
félisten
Milyen tesla? A problema 4GiB memoria felett jon elo, mert akkor mar 64 bites BAR regiszterre van szuksege, azt meg a legtobb alaplap nem tamogatja. Z97-tol kezdtek szallingozni olyan lapok, amelyek tamogatjak, de X99 platformon (pl. osszes Asrock) sem mindenhol tamogatott.
[ Szerkesztve ]
-
Reggie0
félisten
Milyen lapban? Lehet van naluk is kivetel. Az extreme 3 es 4 biztosan nem megy, de volt akinek sikerult moddolt biost kunyeralni az asrocktol, amit az oldalukrol nem lehet letolteni.
Igen, Asrockbol a WS-E/X99E-ITXac biztos tudja, WS/Extreme 3/4/6/Fatal1ty killer/Fatal1ty killer X99X/OC formula/Professional biztos nem tudja. (Biosban "Above 4G Decoding" altalaban az opcio neve, amire szukseg van.)
[ Szerkesztve ]
-
Reggie0
félisten
Az, hogy a titan X-nel es egyebb gamer kartyaknal csak parszaz MiB memoria van mappelve a PCIe buszra es lapozni kell az osszes eleresehez, mig a Teslaknal a teljes memoria mappelve van. Ezert az elobbinek eleg 32 bites BAR regiszter, mig az utobbinak 64 bites kell es ezt jellemzoen nem tamogatjak a biosok.
[ Szerkesztve ]
-
Reggie0
félisten
-
#95904256
törölt tag
válasz Dyingsoul #27 üzenetére
A helyzet az, hogy amit leírtál az jól hangzik, amennyiben a szuperszámítógép tulajdonosát nem érdekli, hogy hová is folyik a pénz. Pl. egy saját gépparkkal rendelkező, azt bérbe nem adó, állami kutatóintézetnél miért is ne...
Amúgy meg hónapokkal előre le kell foglalni ezeket a gépeket, iszonyat pénzekért. Aztán ha olyankor olyan kódot viszel oda aminek a futásideje nem fért be a gépidőbe, akkor pechetek van...
-
lenox
veterán
Megneztem, de a neten se talaltam X99M Extreme4/3.1-et meg ezen a lapon is csak azt latom, hogy Extreme4. Milyen keywordot kell keresni az asrock oldalan, amivel ezt a jellemzojet mondak meg egy lapnak? Amugy most kene vegyek egy mezei konzumer szintu gepet, amin jo lenne, ha menne, sima haswell/skylake i7-et supportalo lapokbol melyikkel nem kene problemam legyen? Amugy egy regebbi supermicro servernel volt olyan, hogy nem indult el a k80, gondolom az lehetett ez a problema.
Új hozzászólás Aktív témák
- OLED TV topic
- Autós kamerák
- HBO Max & OD topic
- Google Pixel 8 Pro - mestersége(s) az intelligencia
- Milyen TV-t vegyek?
- Horgász topik
- Azonnali informatikai kérdések órája
- BestBuy topik
- Samsung Galaxy S23 és S23+ - ami belül van, az számít igazán
- Ki hozhat AI-funkciókat az iPhone-ra?
- További aktív témák...
- ASUS ROG STRIX Z370-H GAMING + Intel Core i5-8600K + SK Hynix 16GB DDR4 2666MHz - Számla + Garancia
- VADIÚJ, BONTATLAN! Mac Mini M2 8GB 256GB
- i7 7700K////1070 TI///16GB
- Intel NUC5CPYH (Celeron N3050, N3060, J3060) - 4GB RAM, 120GB SSD
- Eladó! ASRock H110M-ITX/AC + Intel I5 7500 (csomagküldés az árban)