Új hozzászólás Aktív témák
-
flugi
tag
ha sok alkalmazást, sok komponenst akarsz felgyorsítani, az természetesen alkalmazásonként, komponensenként lesz 2 hét
Nem mellesleg nem akarsz h263 encodert optimalizálni, mivel szinte mindegyik tuningolt encoder függvénypointer tömbökben címezget, amit nem lehet megfogni pragmákkal.
A képnézegetőn nincs mit gyorsítani. Az effektek némelyikén lehet, hogy van mit. Ezek megvizsgálása, hogy lehet-e pragmázni, és rápróbálni a pragmákat, hogy gyorsabb lett-e, ez viszont megint a 2 hetes munkaidő alatt megvan mindenestül, persze effektenként (legyenek akárhány sorosak).
-
con_di_B
tag
Most csak egy szerencsétlen megfogalmazáson rágódsz. Az ő eszközükkel magának az "elemi forrásfájlnak" (magyarul amiből kernelt kéne fordítani) a hossza az ami nem igazán releváns, értelemszerűen, más jellegű kódkomplexitásra (pl. funkcionális) ez már nem igaz.
Nekem inkább az a problémám az elképzeléssel, hogy erre csak akkor lehet jó heurisztikákat mondani, hogy mit, hogy érdemes megírni/"lefordítani", ha már vannak helytálló best practices módszertanaink. Na ilyenek ma még nincsenek. Persze, rengeteg szép whitepaper volt/van, de a gyakorlatban minden ilyen elég könnyen be tud dőlni, elég egy driverfrissítés, amiben megoldanak valamit aminek eddig is gyorsnak illett volna lennie, csak eddig nem volt az... Vagy épp, hogy soha nem oldják meg...
-
flugi
tag
furcsa módon, de igen, ha eleve alkalmas a kód. Ilyenkor a ciklusmag mérete irreleváns, a párhuzamosítási pont létezése a feltétel, és ilyen pontból kevésnek kell lennie, különben érdemi gyorsulás nem elérhető, tehát nem eleve alkalmas a kód.
Félreértés ne essék, eleve alkalmas kódból kevés van, de egy kellőképpen elegáns programban azért könnyebb találni gyorsítható részeket, mint egy asm betétekkel gazdagon díszített hackorgiát.
-
flugi
tag
majdnem pontosan így van, de szerencsére vannak magasszintű párhuzamosságot adó megoldások is, amiket könnyű lehet lecserélni. Például egy OpenMP alapú multithread megoldás triviálisan alakítható át az esetek zömében.
Egy socket szintű grid implementációt görgető rendszer meg nem fog tudni alkalmazkodni.
Nemrég dolgunk volt egy batárnagy fortran programmal. Nem kívánom senkinek.
-
flugi
tag
Amire ez hasonlít, az az MS AMP. Vagy a mi cuccunk: http://www.youtube.com/user/MrFlugi#p/a/u/0/31xKQ_9MN_k
Az a lényege, hogy ha a kódod olyan, hogy az algoritmus gyorsabban menne GPU-n, akkor a fordítóval elintézzük, hogy azon is fusson. Ez tényleg 2 heti meló.
Újraírni az algoritmust, hogy GPU barát legyen, az meg sok idő.
-
con_di_B
tag
LoL
Egy dologra egyébként jó lehet: meglévő C/C++/Fortran kódbázis HPC-sítésére. Viszont ha azok a kódok már eleve HPC-re vannak, akkor smemi szükségük ilyen megoldásokra, mert már eleve valamelyik natív környezetben lettek elosztott rendszerként lefejlesztve, ha meg most akarják átmókolni, akkor jobban járnának ha inkább újraírnák, csak még nem tudják.
-
vinibali
őstag
nagyon erősnek tűnik a kezdeményezés. kíváncsi leszek ha az FSA mellett teszi majd le voksát az új XBOX lesze-e még ennek létjogosultsága?
-
con_di_B
tag
És erre mi szükség van az OpenCL mellett? Csak a reference cardot néztem át, de abban nem láttam semmit, amit abban ne lehetne.
-
moli.hu
őstag
az elérhető gyorsulás nagyon függ az adott programkódtól, de a tapasztalatok azt mutatják, hogy két hetes munkával a kétszerestől kezdve akár a tízszeres gyorsulás is elérhető.
2 hetes munkaval?
-
radi8tor
MODERÁTOR
Ez nekem kínai.
Hangolják össze jobban a drivereket a játékokkal.
Új hozzászólás Aktív témák
- OLED monitor topic
- Intel Core i5 / i7 / i9 "Alder Lake-Raptor Lake/Refresh" (LGA1700)
- Opel topik
- sziku69: Fűzzük össze a szavakat :)
- Hajmeresztő ajánlat: 34,5 milliárd dollárért vinnék a Google Chrome böngészőjét
- AMD Ryzen 9 / 7 / 5 9***(X) "Zen 5" (AM5)
- Luck Dragon: Asszociációs játék. :)
- QNAP hálózati adattárolók (NAS)
- Formula-1
- E-roller topik
- További aktív témák...
- Telefon felvásárlás!! iPhone 13 Mini/iPhone 13/iPhone 13 Pro/iPhone 13 Pro Max/
- Apple MacBook Air 13 2017 A1466 512Gb SSD / i7 / 8GB RAM / 12 hó jótállás
- LG 27GR83Q-B - 27" IPS / QHD 2K / 240Hz & 1ms / NVIDIA G-Sync / FreeSync / DisplayHDR 400
- Eredeti DELL 240W töltők (LA240PM160)
- GYÖNYÖRŰ iPhone 13 mini 128GB Green -1 ÉV GARANCIA - Kártyafüggetlen, MS3141, 95% Akkumulátor
Állásajánlatok
Cég: FOTC
Város: Budapest