Új hozzászólás Aktív témák
-
joysefke
veterán
Nekem nagyon tetszik ez a vezérelv és szerintem a teszteredményeket is érthetővé és védhetővé teszi. Így a tesztek legalább meg tudnak válaszolni egy releváns kérdést, hogy mi az ami az adott processzorcsaládban benne van egy-egy szituációt (algoritmust tekintve). Hogy a valós életben egy produktív szoftver ebből mit hoz ki az megint egy másik jóval messzebb vezető kérdés amire a válasz ráadásul időben is változik.
A ricsip féle felvetéssel az a bajom, hogy minnél gépközelibb a kód (és itt benchmarkról van szó, tehát az lesz), szerintem annál kevésbé megvalósítható a gyakorlatban olyan, hogy architektúrafüggetlen pártatlan minden hasonló generációs processzor számára nagyjából egyenlően jó gépi kód.
Gondolom az assemblyfejlesztő is nyilván valamilyen gépen fejleszt, menet közben teszteli az egyes szubrutinokat, számszerűsíti, hogy az egyes iterációs változtatások gyorsítanak vagy inkább lassítanak. Aztán ennek köszönhetően a végén a kód nem csak a támogatott utasításkészlethez, hanem a fejlesztéskor használt processzor belső felépítéséhez (cache, elágazásbecslés, párhuzamosan végrehajtott skalár utasítások száma, utasítások késleltetése) is adaptálódik.
Gondolom ebben az esetben az egyébként hasonlóan gyors és hasonló utasításkészleteket támogató i7 7700K és R3 3300X közül is az lenne a gyorsabb amely architektúrán éppen készült az adott tesztesetre a kód. Ez meg nem valami pártatlan...
-
joysefke
veterán
Tök jó, hogy a fejlesztő is benéz a topikba 🙂
Szeretném megkérdezni, hogy amikor egy egy utasításkészletre pld avx2 készül a kódút, akkor mennyire van vagy nincsen a különböző azt a kódutat majd futtató architektúrák sajátosságai pld az cache mérete és felépítése asszociativitása figyelembe véve? Mi arra a stratégia, hogy kijöjjön a procik ereje, de semelyik ne kerüljön indokolatlan előnybe vagy hátrányba? -
joysefke
veterán
Az estek hány százalékaban van szükség AVX512 készletre?
A SIMD (SSE, AVX) képes programok deszktopon nem így működnek. Megnézik, hogy milyen utasításkészleteket támogat a processzorod, és az elérhető, annak megfelelő legjobb kódutat futtatják rajta. Ha nem támogat AVX512-t, de támogat AVX2-t és a program arra is tartalmaz optimalizációt, akkor az AVX2-es kódút fog futni.
-
joysefke
veterán
Úgy látom a ZEN4 büntet hiába "csupán" két részletben dolgozza fel az AVX-512 vektorait. Kíváncsian várom a 9950X (ZEN5) eredményét ahol nyilván javítottak az első generációs AVX512 implementáción illetve az 512 bites vektorok feldolgozása már egyben fog történni.
Új hozzászólás Aktív témák
- Manjaro Linux
- AMD K6-III, és minden ami RETRO - Oldschool tuning
- SUSE Linux
- Okos Otthon / Smart Home
- Hamarosan körbefotózza a Google a Balatont
- Crimson Desert
- sziku69: Fűzzük össze a szavakat :)
- Samsung Galaxy Felhasználók OFF topicja
- A fociról könnyedén, egy baráti társaságban
- Eredeti játékok OFF topik
- További aktív témák...
- 230 - Lenovo Legion 5 (15IRX10) - Intel Core i7-13650HX, RTX 5060
- BESZÁMÍTÁS! ASRock B650 R7 8700F 32GB DDR5 1TB SSD RTX 3080 10GB LIAN LI LANCOOL 217 fehér 750W
- BESZÁMÍTÁS! Intel Core i9 11900KF 8 mag 16 szál processzor garanciával hibátlan működéssel
- Asus VZ239 23 Full HD Monitor 6 hó garancia Házhozszállítás
- GYÖNYÖRŰ iPhone 14 Plus 128GB Starlight -1 ÉV GARANCIA - Kártyafüggetlen, MS4458
Állásajánlatok
Cég: Laptopműhely Bt.
Város: Budapest
