Keresés

Új hozzászólás Aktív témák

  • Fiery

    veterán

    válasz letepem #14129 üzenetére

    Semmikepp sem lepi tul, azt legfeljebb a Skylake tudja majd megtenni (ha egyaltalan). A Broadwell feature szinten tamogatja az OpenCL 2.0-t es az SVM-et (megosztott memoria), de arrol nincs infom, hogy ez pontosan mikepp van megoldva hardveresen. Nem gondolnam, hogy olyan mely es jol mukodo az integracio, mint a Kaverinal, de kizarni sem tudom annak a lehetoseget. Az Intelnek volt ideje boven arra, hogy a Kaveri-fele SVM megoldast ugymond lemasolja, sz'al elvileg be lehet epiteni a Broadwellbe is, csak kerdes, hogy mennyire van ennek ertelme egy ilyen inkrementalis fejlesztesnel (Haswell --> Broadwell). Szamomra logikusabbnak tunik az, hogy csak a Skylake lesz "valodi" SVM, a Broadwellnel meg valamifele takolassal oldjak meg.

  • Abu85

    HÁZIGAZDA

    válasz letepem #14129 üzenetére

    A Broadwell nem támogatja az OpenCL 2.0 C11 Atomics és Pipes funkcióját. A Kaveri ezeket is tudja.

    Alapvetően az OpenCL 2.0 arról szól, hogy az IGP és a CPU ugyanazt a memóriát használja. Az SVM funkció teszi ezt lehetővé technikailag, így a két részegység egységes virtuális memóriát támogat. Ez egy alap, és minden adatmásolástól megkíméli a rendszert. Erre jön rá a C11 Atomics (szokás Platform Atomics néven is emlegetni), ami arra szolgál, hogy a programokban jellemzően használt adatstruktúrákat hatékonyabban lehessen kezelni.
    Például a bináris fa adatszerkezet nagyon jellemző a mai világban. A hagyományos modellel a CPU-nak és a GPU-nak úgy kellett dolgoznia, hogy a bináris fát a két különálló memóriaterület között folyamatosan másolgatni kell. Az SVM ezt a másolgatást kiüti, de C11 Atomic nélkül a CPU és a GPU továbbra sem érheti el a fát párhuzamosan, mert nincs ami szinkronizálja a hozzáférést. Lényegében a C11 Atomic bináris fa adatszerkezet esetén annyit tesz, hogy engedi a két részegységnek az adatokhoz való párhuzamos hozzáférést, amellett, hogy az SVM-nek hála már adatmásolás sincs.
    Végül a Pipes az egy olyan memóriaobjektum, ami az adatokat FIFO elv szerint raktározza. Ezzel próbálja a Khronos megszüntetni a jelenlegi OpenCL modell legnagyobb rákfenéjét, hiszen új programozási paradigmát tesz lehetővé. Ezzel a programozó képes lesz az esetleg szükséges expansion kernel mellett bármilyen más kernelt futtatni, vagyis az expand kernelnek nem kötelező előbb lefutnia. Ez ma probléma, mert az expansion kernel alacsony GPU kihasználtságot eredményez és magas a sávszélesség igénye is, tehát rontja a hardver kihasználhatóságát.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

Új hozzászólás Aktív témák