Új hozzászólás Aktív témák
-
flugi
tag
ha sok alkalmazást, sok komponenst akarsz felgyorsítani, az természetesen alkalmazásonként, komponensenként lesz 2 hét

Nem mellesleg nem akarsz h263 encodert optimalizálni, mivel szinte mindegyik tuningolt encoder függvénypointer tömbökben címezget, amit nem lehet megfogni pragmákkal.
A képnézegetőn nincs mit gyorsítani. Az effektek némelyikén lehet, hogy van mit. Ezek megvizsgálása, hogy lehet-e pragmázni, és rápróbálni a pragmákat, hogy gyorsabb lett-e, ez viszont megint a 2 hetes munkaidő alatt megvan mindenestül, persze effektenként (legyenek akárhány sorosak).
-
con_di_B
tag
Most csak egy szerencsétlen megfogalmazáson rágódsz. Az ő eszközükkel magának az "elemi forrásfájlnak" (magyarul amiből kernelt kéne fordítani) a hossza az ami nem igazán releváns, értelemszerűen, más jellegű kódkomplexitásra (pl. funkcionális) ez már nem igaz.
Nekem inkább az a problémám az elképzeléssel, hogy erre csak akkor lehet jó heurisztikákat mondani, hogy mit, hogy érdemes megírni/"lefordítani", ha már vannak helytálló best practices módszertanaink. Na ilyenek ma még nincsenek. Persze, rengeteg szép whitepaper volt/van, de a gyakorlatban minden ilyen elég könnyen be tud dőlni, elég egy driverfrissítés, amiben megoldanak valamit aminek eddig is gyorsnak illett volna lennie, csak eddig nem volt az... Vagy épp, hogy soha nem oldják meg...
-
flugi
tag
furcsa módon, de igen, ha eleve alkalmas a kód. Ilyenkor a ciklusmag mérete irreleváns, a párhuzamosítási pont létezése a feltétel, és ilyen pontból kevésnek kell lennie, különben érdemi gyorsulás nem elérhető, tehát nem eleve alkalmas a kód.
Félreértés ne essék, eleve alkalmas kódból kevés van, de egy kellőképpen elegáns programban azért könnyebb találni gyorsítható részeket, mint egy asm betétekkel gazdagon díszített hackorgiát.
-
flugi
tag
majdnem pontosan így van, de szerencsére vannak magasszintű párhuzamosságot adó megoldások is, amiket könnyű lehet lecserélni. Például egy OpenMP alapú multithread megoldás triviálisan alakítható át az esetek zömében.
Egy socket szintű grid implementációt görgető rendszer meg nem fog tudni alkalmazkodni.
Nemrég dolgunk volt egy batárnagy fortran programmal. Nem kívánom senkinek.
-
flugi
tag
Amire ez hasonlít, az az MS AMP. Vagy a mi cuccunk: http://www.youtube.com/user/MrFlugi#p/a/u/0/31xKQ_9MN_k
Az a lényege, hogy ha a kódod olyan, hogy az algoritmus gyorsabban menne GPU-n, akkor a fordítóval elintézzük, hogy azon is fusson. Ez tényleg 2 heti meló.
Újraírni az algoritmust, hogy GPU barát legyen, az meg sok idő.
-
con_di_B
tag
LoL

Egy dologra egyébként jó lehet: meglévő C/C++/Fortran kódbázis HPC-sítésére. Viszont ha azok a kódok már eleve HPC-re vannak, akkor smemi szükségük ilyen megoldásokra, mert már eleve valamelyik natív környezetben lettek elosztott rendszerként lefejlesztve, ha meg most akarják átmókolni, akkor jobban járnának ha inkább újraírnák, csak még nem tudják.

-
vinibali
őstag
nagyon erősnek tűnik a kezdeményezés. kíváncsi leszek ha az FSA mellett teszi majd le voksát az új XBOX lesze-e még ennek létjogosultsága?

-
con_di_B
tag
És erre mi szükség van az OpenCL mellett? Csak a reference cardot néztem át, de abban nem láttam semmit, amit abban ne lehetne.
-
moli.hu
őstag
az elérhető gyorsulás nagyon függ az adott programkódtól, de a tapasztalatok azt mutatják, hogy két hetes munkával a kétszerestől kezdve akár a tízszeres gyorsulás is elérhető.
2 hetes munkaval?

-
radi8tor
MODERÁTOR
Ez nekem kínai.

Hangolják össze jobban a drivereket a játékokkal.
Új hozzászólás Aktív témák
- Xiaomi 17 Ultra - jó az optikája
- Star Trek
- Luck Dragon: Asszociációs játék. :)
- Motorolaj, hajtóműolaj, hűtőfolyadék, adalékok és szűrők topikja
- MIUI / HyperOS topik
- Parkside szerszám kibeszélő
- Wuthering Waves
- Samsung Galaxy Felhasználók OFF topicja
- One otthoni szolgáltatások (TV, internet, telefon)
- Xbox tulajok OFF topicja
- További aktív témák...
- GYÖNYÖRŰ iPhone 14 Pro Max 128GB Deep Purple - 1 ÉV GARANCIA -Kártyafüggetlen, MS3702
- Canon MG2450 multifunkciós nyomtató + új színes patron
- Xiaomi Redmi Note 14 Pro + 512GB // ÁFÁS számla // GARANCIA //
- BESZÁMÍTÁS! Palit Gaming Pro RTX 3070 Ti 8GB videokártya garanciával hibátlan működéssel
- Owl Labs Owl Bar 4K Videokonferencia Rendszer FRS100
Állásajánlatok
Cég: Laptopműhely Bt.
Város: Budapest







