Új hozzászólás Aktív témák
-
LordX
veterán
VLIW4 gépen VLIW5 kódot ha beleszakadsz sem fogsz tudni futtatni, de még VLIW5 és VLIW5 között is lehetnek masszív különbségek, amit fordító nélkül úgyse fogsz megoldani, de hatékonyan még inkább nem (pl. VLIW equals scheduling model, különböző pipeline hosszal, vagy csak simán különböző számú delay slot..). A VLIW pont annak mintapéldája, amit direkt úgy terveznek, hogy van jó fordító (és ennek hiánya miatt bukott eddig mindegyik) - nem is véletlen, hogy átálltak skalárra AMD-ék.
-
LordX
veterán
válasz
#06658560 #29 üzenetére
Mutasd meg a legutolsó programot, amit 100% ASM (vagy lejjebb) volt programozva. Megmondom neked: Transport Tycoon Deluxe, 1995. Disclaimer: nem az a lényeg, hogy pont ez a játék, hanem hogy mikor történt. Azóta minimum C, és csak a kritikus részekben vannak ASM utasítások (vagy még az se, megállnak intrinsics-nél). Ma már ott tartunk, hogy néhol JavaScriptben(!!!) csinálnak számításokat (mondjuk az már erősen /facepalm kategória).
Fiery: Azért nincs ASM AMD kártyákra, mert minden 3. évben kijön egy gyökeresen új ISA, és dobhatnád ki az egész kódodat a francba. Nagyon, NAGYON kevesek engedhetik meg maguknak, hogy ez így menjen, a 99%-hoz még pár kilencest nyugodtan hozzá lehet írni. <1% userre meg senki nem fog új nyelvet/API-t/fordítót fejleszteni 3 évre (de néha még 10%-ért sem). A Mantle nagyon nem ugyanaz a kategória, az egy tényleges piaci rést céloz meg, nem véletlenül néz ki majdnem ugyanúgy, mint az új konzolok APIjai.
-
LordX
veterán
Ez a legnagyobb hülyeség amit tőled valaha olvastam, már bocsánat. Ha direkten szálakat futtatok, akkor nincs szinkronizáció? Annak nincs overheadje, akár kézzel történik (-> extra meló), akár az oprendszer csinálja (túl általános célú -> gyenge perf)? Nem véletlenül van context meg command queue - pontosan erre.
És hogy írjak direkten ASM utasításokat? Mert a C++ fordító, OpenCL fordító nem ismeri őket, vagy mi? Ilyen alacsony szinten ma már senki nem dolgozik komolyan. Max egykét kritikus ponton optimizál kézzel, de ez pont azt jelenti, hogy nem dobják ki a magas szintű programnyelvet.
Nem ez a különbség. A hagyományos grafkártya data parallel modellben működik, az Intel MIC meg task parallel. A kettő ég és föld - egyik se jobb a másiknál (azonos elméleti peak teljesítmény mellett, és itt viszont úgy tűnik a GPU-knak áll a zászló), de ha a másik kabátját akarod ráhúzni, akkor eléggé döcögősen fog menni.
Új hozzászólás Aktív témák
- Csere-Beszámítás! Sapphire Pure RX 7700XT 12GB GDDR6 Videokártya! Bemutató Darab!
- PowerColor RX 6700 XT 12GB GDDR6 Hellhound Eladó!
- Garis ZOTAC GeForce RTX 4070 Ti Trinity 12GB GDDR6X videokártya
- Csere-Beszámítás! Sapphire Nitro+ RX 7800 XT 16GB GDDR6 Videokártya! Bemutató Darab!
- ASUS TUF Gaming GeForce GTX 1660 Ti OC 6GB GDDR6 192bit
Állásajánlatok
Cég: Promenade Publishing House Kft.
Város: Budapest
Cég: PCMENTOR SZERVIZ KFT.
Város: Budapest