Keresés

Új hozzászólás Aktív témák

  • S_x96x_S

    őstag

    válasz Petykemano #3559 üzenetére

    > De miért ne lehetne az AVX512-t, vagy későbbieket olyanná "tenni"

    majd valamit az AMD kitalál ...

    de amúgy nincs könnyű helyzetben ...
    ha meg teljesen új dolgot csinál .. akkor csak a fragmentációt növeli ..

    én amúgy az AMD helyében az APU-s dolgot erőltetném ...
    vagyis az AVX-512 -es utasításokat valami belső fordító áttolja a GPU részre .. és ott hajtódnak végre. persze ez a gyakorlatban nem biztos, hogy optimális ...

    ami érdekes az Raja - OneApi -ja ... ami automatikusan osztja el a feladatot a cpu és a gpu között ... szerintem ez lehet az Intel "B" terve ... az AVX-512 mellett ...

    és ne felejtsük el a fejlesztés alatt álló Centaur Technology -s CNS -core ... ami szintén az AVX-512 -es piacra pályázik ...

    > hiszen az SVE2-ben ha jól értem az utasításkészlet megegyezik,
    > és a hardver vektorhossz-képességével lehet szegmentálni.
    > Az intel meg ezt összekötötte

    igen .. az én megértésem is hasonló ..

    Az ARM kód binárisan ugyanaz ..
    mig az X86( Intelnél) ... nem lehet tudni, hogy az 1024 bites utasításoknak mi lesz a kódja ..
    a 2048-asokat meg végképp nem .lehet tudni ..
    míg az új ARM-es hardvereket rögtön ki tudják használni a szoftverek ..
    az új Inteles AVX-1024 -es kódnál ez nem igaz .. . hasonló mint most az AVX-512 ... kevés program használja ki .. kell új fordító támogatás ... stb ...
    nehezebb a hibakeresés és a debuggolás is ...

    --------------------
    amúgy ha valaki nem érti az avx-512 fragmentációt annak itt egy ábra ..

    [ Szerkesztve ]

    Mottó: "A verseny jó!"

  • Balala2007

    tag

    válasz Petykemano #3559 üzenetére

    Van az AVX, AVX2, AVX256 és AVX512 között más különbség is, mint a vektorhossz?

    Marmint
    - a plusz 16 regiszter (4x regiszterter)
    - a +8 kreg es maszkolhatosag
    - a szinte teljes adatortogonalitas es konvertalhatosag
    - a disp8 tomorites
    - az implicit blending/zeroing
    - az implicit broadcasting
    - a ternlog
    - a rotalas/v rotalas
    - a 2-source crosslane permutaciok
    - a compress/expand
    - a full popcnt
    - az 8x8bit affin transzformacio
    - scatter/gather-en kivul?

    Egy rakas FP cucc, de azt most nem mondom el.

    AIDA64.com

Új hozzászólás Aktív témák