Új hozzászólás Aktív témák
-
HSM
félisten
válasz
S_x96x_S #5951 üzenetére
"Az AMD szerencséje, hogy a Desktop- AlderLake-en a Big-Little miatt ezt nagyrészt nem lehet elérni, de szerver szinten elég ütős tud lenni, hogyha a program ki tudja használni."
Nem hiszem, hogy asztali alkalmazásoknál ennek bármi jelentősége lenne. Szerveres téren sem túlzottan nagy az elterjedtsége, nem véletlen, hogy szervereken is tarolt a Zen3, hiába nincs AVX512 benne."A korai Inteles AVX-512 implementációknál - annyira átmelegedett a chip; hogy az AVX-512 -es utasításoknál vissza kellett szabályozni magát .. csak, az volt a probléma, hogy a teljes rendszert lefolytotta."
Szerintem hibás a gondolatmeneted. A probléma abból eredt, hogy Intel rendszereken minden magnak közös a szorzója, nem tudnak különböző órajeleken és feszültségeken üzemelni. Ez asztali CPU-k esetén is igaz, hogy pl. aktív AVX2 feldolgozás esetén csökken az elérhető maximális órajel (AVX offset). Ennek nincs köze a csip "átmelegedéséhez", főleg nem ennek következtében történő szabályozási folyamatokhoz. Természetesen AVX mellett nagy valószínűséggel melegebb lesz a csip, valamint a jelenlegi Intel implementációkon az AVX-mód váltásnak is van némi költsége, ezeket is írja is részletesen az optimalizálási dokumentáció. Ugyanakkor a tapasztalatom az, hogy tömény AVX feldolgozás esetén sokkal nagyobb mértékben nő a teljesítmény, mint a fogyasztás, ami kompenzálja az órajel csökkenést: [link] (AVX1 vs. AVX2, "POUT" vs Gflops.).
Probléma leginkább az általad linkelt cikkben szépen leírt esetben van, ahol nagyon sokféle a feldolgozás, és az utasítások nagyon kis része AVX-es, így a módváltás költsége és az órajelcsökkenés már nagyobb veszteség, mint amennyi tempót hoz maga az utasítás készlet abban a kevés utasításban.
Ilyen esetben pl. a jelenlegi Ryzenek máris komoly előnyben vannak, hiszen azok képesek magonként eltérő órajelen üzemelni és AVX-offset sincs legjobb tudomásom szerint.Én amúgy továbbra sem vagyok meggyőződve róla, hogy az AMD-nek valóban az AVX512-t kellene erőltetnie, én jobban örülnék egy inkább általánosabb felhasználásban erős koncepciónak (ahogy a korábbi Zen-ek), ahol pl. csak kiegészítő feture az AVX512, kb. mint az első Zen-eknél a sima AVX2, ahol az alapvetően 128bit széles architektúra két órajel alatt végezte el a 256bites műveleteket. "In the Zen/Zen+ microarchitecture the floating point physical registers, execution units, and data paths are 128 bits wide. For efficiency AVX-256 instructions which perform the same operation on the 128-bit upper and lower half of a YMM register are decoded into two macro-ops which pass through the FPU individually as execution resources become available and retire together. Accordingly the peak throughput is four SSE/AVX-128 instructions or two AVX-256 instructions per cycle." [link]
Új hozzászólás Aktív témák
- Mesterséges intelligencia topik
- Autós topik
- AMD Ryzen 9 / 7 / 5 / 3 5***(X) "Zen 3" (AM4)
- Windows 10
- Formula-1
- Eredeti játékok OFF topik
- Xbox tulajok OFF topicja
- A fociról könnyedén, egy baráti társaságban
- AMD K6-III, és minden ami RETRO - Oldschool tuning
- Milyen processzort vegyek?
- További aktív témák...
- AKCIÓ! ASUS PRO WS W790E-SAGE SE alaplap garanciával hibátlan működéssel
- Honor Magic6 Lite 256GB, Kártyafüggetlen, 1 Év Garanciával
- BESZÁMÍTÁS! 1TB Kingston KC3000 NVMe SSD meghajtó garanciával hibátlan működéssel
- Apple iPhone 14 Plus 128GB, Kártyafüggetlen, 1 Év Garanciával
- BESZÁMÍTÁS! MSI B450M R5 5600 32GB DDR4 512GB SSD RTX 3060 12GB THERMALTAKE Core V21 Enermax 650W
Állásajánlatok
Cég: Promenade Publishing House Kft.
Város: Budapest
Cég: PCMENTOR SZERVIZ KFT.
Város: Budapest