Új hozzászólás Aktív témák

  • S_x96x_S

    őstag

    válasz Szeszkazán #7441 üzenetére

    > AVX512 teljesítmény ... PC oldalról kutyát se érdekli?

    az Intel a P-E-s architektúrájával lényegében egy időre kinyírta ..
    (12gen, 13gen -ben nem lesz.)
    úgyhogy elég lassú lesz a desktop-os adaptáció.

    A probléma az, hogy csak pár hónapos optimalizálási munka után derül ki, hogy mennyi a valós haszna az adott programban ..

    és lehetnek meglepetések
    pl.
    https://prohardver.hu/hir/csokken_avx-512_tamogato_program_szam.html
    "Elméletben tehát hiába tűnt jó ötletnek az AVX és AVX-512 támogatásának hozzáadása a LibreOffice 7.3-hoz, az extra kódok karbantartásával járó potenciális problémák annyira jelentősek, hogy a gyakorlatban ezeket nincs értelme felvállalni."

    Vagyis ne várj gyors AVX512-es adaptációt a Desktop fronton.
    Néha teljesen újra kell irni a kód egy részét, hogy optimális legyen az avx-512-nek.

    viszont egyes programokat nagyon meg tud lökni teljesítményben
    pl. PS3 emulátor.

    AVX-512 Patch Brings 30% Performance Uplift to PlayStation 3 Emulator
    "When you need to emulate Cell, you need explicit parallelism and large file registers, a combination that AVX-512 CPUs feature. As it turns out, the LVVM compiler automatically chooses the best possible code path, which in case of AVX-512-enabled hardware means an appropriate code path. For obvious reasons (we are talking about emulation here at the end of the day) it is not exactly ideal, not all mask registers can be used, for example.
    AVX-512 also adds new mask registers which can be optionally used with EVEX encoded instructions,” wrote Whatcookie. “There are new comparison instructions which generate a mask in the mask registers as the result of a comparison between vectors. When a mask register is used as an operand all of the elements not selected by the mask will either be zeroed or leave the existing value in the destination register untouched. There are 8 mask registers, through k0 - k7, however only k1 - k7 can be used to mask things out, as k0 implicitly behaves as if all elements are selected.”"

    // edit .. ahogy látom lassú voltam és megelőztek a PS3 emulátoros példával .. //

    [ Szerkesztve ]

    Mottó: "A verseny jó!"

Új hozzászólás Aktív témák