Új hozzászólás Aktív témák

  • Fiery

    veterán

    válasz LordX #28 üzenetére

    Koszonom az elismero szavakat :)

    "Ha direkten szálakat futtatok, akkor nincs szinkronizáció? Annak nincs overheadje, akár kézzel történik (-> extra meló), akár az oprendszer csinálja (túl általános célú -> gyenge perf)? Nem véletlenül van context meg command queue - pontosan erre."

    Miert kellene az oprendszer szalkezelesenek lassunak lennie? A Knights Landing be tud majd bootolni egy oprendszert, tehat valamilyen szinten az oprendszer fogja kezelni es utemezni a MIC magokat. Ha a Knights Landingnel ezt megoldjak, akkor miert ne oldhatnak meg a Skylake-nel vagy a Goldmont-nal is?

    Az assembly hogyan mukodik x86-on? Yasm peldaul? No rocket science. GCN-re, Keplerre, az Intel GenAkarmennyijeire nincs assembly, pontosabban nem nyilt a rendszer. MIC-re -- ha az Intel egy kicsit is okosan csinalja -- lesz x86 assembler, jo esellyel a Yasm is tud majd forditani ra.

    "Ilyen alacsony szinten ma már senki nem dolgozik komolyan"

    Mi ennel alacsonyabb szinten is dolgozunk komolyan. Pl. kodgenerator, direkt gepi kodu programozas, stb. De persze tudom, hogy a fejlesztok 99%-a nem mereszkedik idaig, tudom hogy kisebbsegben vagyunk. Az extrem optimalizaciohoz azonban a legjobb megoldas mindig az, ha nem kell OpenCL, D3D, OpenGL es hasonlo overheadekkel vacakolni. A Mantle sem veletlenul szuletett, ott is az overheadet probaljak lekuzdeni.

Új hozzászólás Aktív témák