Keresés

Új hozzászólás Aktív témák

  • hokuszpk

    nagyúr

    válasz thgergo #3577 üzenetére

    nohat akkor azt tudom mondani hajra A?? :DDD

    [ Szerkesztve ]

    Első AMD-m - a 65-ös - a seregben volt...

  • joysefke

    veterán

    válasz thgergo #3577 üzenetére

    Különben ott a GPU/Xeon phi vagy másegyéb gyorsító a célfeladatra pl FPGA.

    Ezt nem tudom, azokat még játék szinten sem programoztam soha (SSE-AVX-et intrinsic-kel igen, hobbiból megvalósítottam pár egyszerűbb képfeldolgozó algoritmust) mindenesetre szerintem arra nem lehet építeni, hogy a usernek majd pont lesz megfelelő GPU-ja és arra pont van megfelelő driver installálva. Ezzel szemben, a legalább SSE 4.2 vagy akár AVX képes processzor az adott.

    ==
    AVX2 és AVX512 kód között csak pár % teljesítményelőnyt tapasztaltam, intel MKL, cascade lake csodákkal.

    Én még azt olvastam, hogy bár az Avx512 kód lehet akár gyors is, azonban ha csak kevés Avx512 utasítást kell végrehajtani, akkor könnyen elmarad a gyorsulás (vagy még lassul is) mert az Avx512 kód alacsonyabb órajelen fut és utána viszonylag hosszú időre (~ms nagyságrend) van szükség, hogy visszaugrojon az órajel, tehát azon a szálon az Avx512 utasítások utáni kódrészlet lényegesen lassabb lesz, mintha nem Avx512 futott volna előtte.

    Na most ha ez így van, akkor ennek fényében, a fenti utasítás halmazábra fényében és annak fényében, hogy az egyes processzorok még különböző számú Avx512 képes egységet tartalmaznak, ki fogja érdemben kitsztelni/eldönteni, hogy egy adott függvény esetén melyik processzorcsalád melyik kódutat futassa? Nekem ez laikusként aránytalan munkának tűnik ahhoz képest, hogy mekkora gyorsulásra lehet elméletben képes az Avx512.

    Vagy Avx512 eleve csak szuperszámítógépek esetén lesz hasznos, ott meg majd megírják a kódot az adott processzorhoz? :F

    [ Szerkesztve ]

Új hozzászólás Aktív témák