Keresés

Új hozzászólás Aktív témák

  • Petykemano

    veterán

    válasz lezso6 #41633 üzenetére

    A kompos példámban egy forduló egy órajelciklus. Így nem kell belékeverni az adhoc választott sebességet.

    Mert valójában is amikor jön egy 64 adatos wave, az bekerül a CU egyik SIMD16-os csövébe, ami 4 órajelciklus alatt (4 fordulóval) tud végezni a csomaggal.

    A kompos példában csak az a kérdés merül föl (ami a kamionosnál soha nem merülhetne fel), hogy miért is kell 64 autónak.összeállnia egy jegyhez.

    Ezt válaszoltad: Wave64 - throughput. Ha nem így lenne, akkor a csoportok (wavek) kezelése több adminisztrációs erőforrást igényelne. (Mondjuk több rajzolási parancsot? Több regisztert, buffert, azélesebb ütemezőt)

    Rendben. De amikor eljut egy wave (64) a CU-ba akkor ott miért nem lehet azt egy helyett egyszerre 4 SIMD16-ra ráküldeni - hisz ugyanaz az utasítás. Egy CU miért nem tudja a neki leküldött wave-eket a saját erőforrásain optimálisan vágrehajtani a wave tényleges elemszámától függően?

    A másik kérdést, hogy miért nem szélesebb a SIMD feldolgozó megválaszoltad. Köszi

  • #82819712

    törölt tag

    válasz lezso6 #41633 üzenetére

    Szeretem mikor példákkal beszélgettek itt mert az széleskörben érthető
    PH Popular Hardver
    csak aztán óvatosan a kompkkal kényes téma ez most még a végén Clark Ádám kell a futószalagba is.
    Igen a sebesség egyértelműen hiányzott a kompokból.
    lehet a dual Cu-ra is kellett volna mondanod egy példát egy építkezésen pakoló két munkással akik az ablakon adják be a cserepet (cache) és emiatt nem kell két munkásnak fel le szaladgálni a lépcsőn dupla ideig.
    Így talán azt a vitát is megúsztuk volna és "a DCU az más" ennyi.

    "így utólag belegondolva lehet az AMD tévedett a 64 szállal kapcsolatban, legalábbis grafika terén, mert ugye compute-ban meg igencsak jó."
    Nem tévedett csupán közös tervezés...
    Eddig is beszélte a reddit népe hogy a Rdna játék arhtektúra és szétválik a computesúlyos GCN-től.
    és nocsak a MAC 4 Vegával (2*2) azaz GCN-el erősít (sok ember meghökkenésére) a compute force-os területen.

    Amire nem harapott rá fura módon senki mint téma az a RNDA2 fix funkciós működése
    "2020-21 will pack some fixed-function hardware for certain real-time ray-tracing effects."

    Akit meg érdekel ilyesmi az [L:https://youtu.be/Ph94nbfB_zM]IDE[/L] megy megnézni. Majd ha megmutatja valaki hogy kell videót beágyazni PHra az szóljon ;) [L:/dl/upc/2019-06/794156_leak.jpg](IMG:/dl/upc/2019-06/794156_leak.thumb.jpg)(/IMG)[/L]

Új hozzászólás Aktív témák