Keresés: - AMD-s mélyvíz: Raphael, Rembrandt, Zen4 - Fototrend Hozzászólások

LOGOUT témák

PROHARDVER! témák

Mobilarena témák

IT café témák

GAMEPOD témák

Keresés

Téma összefoglaló

Utoljára frissítve: 2023-12-13 04:53

Fototrend

OLVASD VÉGIG ALAPOSAN MIELŐTT ÚJ HOZZÁSZÓLÁST ÍRNÁL!!!

Új hozzászólás Aktív témák

#10218 #95904256 törölt tag Yutani #10217

Új Válasz 2011-10-08 05:11:16 #10218
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Yutani #10217 üzenetére

Köszönöm!
#10203 #95904256 törölt tag

Új Válasz 2011-10-07 21:22:10 #10203
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

Esetleg tudnátok ajánlani Bulldozerhez való mATX-es alaplapokat?
#10077 #95904256 törölt tag

Új Válasz 2011-10-01 16:49:34 #10077
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

Hm... vajon mikortól fogja az AMD támogatni az AVX2-őt vagy a 256-bites XOP-ot? A NextGen Bulldozerben lesz BMI, TBM és FMA3, de mi van a 256-bites integer műveletekkel?
#10008 #95904256 törölt tag Giovanny #10004

Új Válasz 2011-09-28 13:34:42 #10008
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Giovanny #10004 üzenetére

A 2600K-ben az AVX miatt rengeteg a tartalék.
Lehet reménykedni, hogy ez felismerik a programkészítők is.
atti_2010: Miért is keresel?
#9933 #95904256 törölt tag Abu85 #9929

Új Válasz 2011-09-26 19:30:48 #9933
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Abu85 #9929 üzenetére

Értem. Ez leolvasható az ábráról? Csak azért kérdem, mert ha komplex számokkal tényleg képes "up to 56x" gyorsabban számolni a Bulldozer, mint a Sandy Bridge, akkor már sejtem, hogy mely utasításokat fogom górcső alá venni ha lesz Bulldozerem...
Egyelőre erősen kétlem, hogy az "up to 56x" a Bulldozerből származik...
Ez akkora szám, hogy az Intelnél fejbelövik a matematikusokat, ha ez így van.
#9928 #95904256 törölt tag Oliverda #9925

Új Válasz 2011-09-26 19:23:09 #9928
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Oliverda #9925 üzenetére

Az OpenCL nem arra szolgál, hogy egy kód heterogén módon CPU és a GPU számítási teljesítményét is ki tudja használni?
#9924 #95904256 törölt tag Abu85 #9912

Új Válasz 2011-09-26 18:43:17 #9924
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Abu85 #9912 üzenetére

Ha jól értem, akkor ezen az ábrán az AMD megmutatta, hogy az OpenCL-t használó Mandelbrot gyorsabban fut egy több száz gigaflops teljesítményű GPU-val megtámogatott Bulldozeren, mint a konkurencia CPU-ján ami nem használja ki a GPU teljesítményét.
Ez így rendben is van, de ez nem igazán a Bulldozer érdeme...
#9909 #95904256 törölt tag Oliverda #9907

Új Válasz 2011-09-26 17:12:57 #9909
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Oliverda #9907 üzenetére

Még nem találtam róluk semmit.
Addig én is eljutottam, hogy OpenCL, Mandelbrot, FMA4. Ezekről még tudom is, hogy melyik micsoda. De ettől még nekem csak színes oszlopok virítanak a képernyőn.
Pl. mi a különbség a "18 float_vector_fma" és a "19 float_vector_fma" közt?
Hm... 8 piros egységgel jobb a Bulldozer. Ja, elnéztem van az 60 is...
#9906 #95904256 törölt tag Remus389 #9903

Új Válasz 2011-09-26 17:02:20 #9906
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Remus389 #9903 üzenetére

(#9903) Remusz911: "harmadik dián porig alázza az Intelt bonyolult matematikai műveleteknél"
Ezekről a bonyolult matematikai műveletekről mesélhetnél egy kicsit. Mert azon a dián látok egy szép oszlopdiagramot, de fogalmam sincs, hogy mi van mögötte.
#9891 #95904256 törölt tag Abu85 #9879

Új Válasz 2011-09-26 05:21:57 #9891
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Abu85 #9879 üzenetére

(#9879) Abu85: "Az AMD az új platformnál valamit ezen a részen csinálhat, vagy hardverből, vagy szoftverből, de látszik, hogy ha sok a rajzolási parancs, akkor az FX-8150 processzor 2-3%-nál gyorsabb a 980X-nél max grafikán. Ez az ami érdekes. Ilyennek a VGA-limit miatt nem szabadna bekövetkeznie, mégis megtörténik. A rajzolási parancsra azért gondolok, mert ez az egyetlen opció, ami a VGA-limitnél gyorsabb feldolgozást eredményez, hiszen ha gyorsabban van kiadva a parancs, akkor gyorsabban lesz kész a képkocka."
Hadd gyártsak alternatívát.
A 2-3% abból is eredhet, hogy az FX-8150 8 szálon képes x87 / SSEx utasításokat végrehajtani, míg a 980X csak 6 szálon. Az FX-6120 csak... egy tesztet megérne.
#9871 #95904256 törölt tag Abu85 #9867

Új Válasz 2011-09-25 18:50:40 #9871
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Abu85 #9867 üzenetére

Ha létezik olyan technológia ami közvetlenül a "VGA-limitet képes kitolni" akkor az nem a Bulldozeren belül van.
#9866 #95904256 törölt tag Abu85 #9863

Új Válasz 2011-09-25 18:26:53 #9866
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Abu85 #9863 üzenetére

Az eltérő Intel / AMD architektúrák közt simán előfordul, hogy az egyik programkód az egyiken fut gyorsabban, míg a másik kód a másikon. Ennek oka sokféle lehet, nem csak az utasítás throughput és latency értékei. Gondolok itt például a cache-line határra nem illeszkedő adatok kezelése vagy az elágazásbecslők és prefetchere hatékonyságára, stb. Szélsőséges esetben ebből simán összejöhet akár 50% különbség is. Lehet, hogy a Dirt3 és Metro2033 programokban többségben vannak azok a kódrészletek amelyek a Bulldozernek kedveznek. Szóval programja válogatja, hogy ki mit szeret.
#9861 #95904256 törölt tag Abu85 #9858

Új Válasz 2011-09-25 17:53:25 #9861
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Abu85 #9858 üzenetére

Ez a skálázódás dolog miből adódik?
Mert én eddig úgy próbálom felfogni, hogy pl. egy "VGA-limites" játék esetén is az rendszer összes többi eleme is felelős a felmutatott végeredményért, csak jóval kisebb mértékben. Ha rendszer valamelyik "kevésbé fontos" elemét ( pl. CPU ) felfejlesztem, mondjuk kétszer erősebbre, akkor az segíthet 2-3%-ot. Erről lenne szó?
Gondolom ezzel azt lehet szemléltetni, hogy a 8 mag és a nagyobb órajel mennyi előnyt jelent a 4-6 maggal szemben.
szerk.: Ok, látom közben megemlítetted, hogy ez a nagyobb throughput miatt van. Vagyis lehet reménykedni, hogy a minimum fps-ek magasabbak lesznek.
#9856 #95904256 törölt tag Oliverda #9852

Új Válasz 2011-09-25 17:24:45 #9856
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Oliverda #9852 üzenetére

Legalább a remény még él...
#9851 #95904256 törölt tag Oliverda #9850

Új Válasz 2011-09-25 16:52:07 #9851
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Oliverda #9850 üzenetére

Még szerencse, hogy egy szóval sem mondtam, hogy a Prohardver!-es cikkben szerepel a "szeptember 26"-ai dátum. Bár úgy látom az tök mindegy mit mondok. Viszont ha ~~pár~~ néhány sorra feljebb is elolvasnád amit linkeltem, abban ott van.
AMD to Formally Unveil Next-Gen Opteron Processors on September 26, 2011
#9849 #95904256 törölt tag Oliverda #9848

Új Válasz 2011-09-25 16:28:22 #9849
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Oliverda #9848 üzenetére

Egy szóval sem mondtam, hogy maradéktalanul megtudhatjuk mire képes a Zambezi. De a fáma ebben a topikban a Bulldozerről szól, nem csak a Zambeziről. Az Interlagos pedig a Bulldozerre épít.
A hír egyébként kb. másfél hónapos, tele van vele a net. Itt az egyik: AMD to Formally Unveil Next-Gen Opteron Processors on September 26, 2011 Talán még itt a Prohardver!-en is volt róla cikk, hogy az Opteronok előbb érkeznek, mint az asztali processzorok.
szerk.: Meg is van: Az AMD az Interlagos szállítását tekinti prioritásnak
#9847 #95904256 törölt tag Oliverda #9846

Új Válasz 2011-09-25 13:58:19 #9847
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Oliverda #9846 üzenetére

Egy szóval sem mondtam, hogy holnap október 12 lesz.
Viszont holnap szeptember 26 lesz, az Interlegos magos Opteronok startja.
#9843 #95904256 törölt tag atti_2010 #9842

Új Válasz 2011-09-25 13:19:29 #9843
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz atti_2010 #9842 üzenetére

Reméljük, hogy holnap már kapunk pár teszteredményt is.
#9801 #95904256 törölt tag Oliverda #9800

Új Válasz 2011-09-23 18:52:46 #9801
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Oliverda #9800 üzenetére

Viszont a sértést sem vettem komolyan.
#9799 #95904256 törölt tag Oliverda #9796

Új Válasz 2011-09-23 17:53:34 #9799
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Oliverda #9796 üzenetére

Ahol képesek több ezer gépből álló clustert kiépíteni, ott biztos találni ilyen embereket is.
#9790 #95904256 törölt tag Zeratul #9788

Új Válasz 2011-09-23 12:52:34 #9790
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Zeratul #9788 üzenetére

Nézted milyen utasításokról van szó? Egyedül a MUL az ami kimutatható változást jelenthet. De csak azért mert a többi szóban forgó utasítás olyan ritka, mint a fehér holló...
#9785 #95904256 törölt tag Zeratul #9782

Új Válasz 2011-09-23 12:14:57 #9785
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Zeratul #9782 üzenetére

Szétválasztáshoz valóban nem kell AVX, hanem egy második szál.
Ismételten jelezném, hogy az egyszálú teljesítményre voltál kíváncsi.
(#9782) Zeratul: "Azt meg nem látom be hogy miért csökkentené a integer végrehajtási sebességet 1 szálon a 2way ha a 3way is csak 1.75 utasításra volt kiterhelve, 1 futószalag csak malmozott és ette az energiát."
Pedig egyértelmű a dolog. Az általad említett 1,75-ös érték egy átlagérték. Az utasítások közti függőségek miatt a kétutas rendszerben ugyanaz a kód kisebb átlagértéket fog produkálni. Gyakorlatilag több órajel kell a lefutásához.
#9780 #95904256 törölt tag Zeratul #9776

Új Válasz 2011-09-23 11:51:41 #9780
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Zeratul #9776 üzenetére

(#9776) Zeratul: "Bull FPU vagy dupla mennyiségű műveletet hajt végre a modul 1 futtatási szálához rendelve vagy szétválasztva mindkét szálon azonos mennyiséget."
Ebben igazad van, de... ahhoz hogy ez így működjön AVX utasításkészletet kell használnod. Néhány kérdés: Szerinted mennyi program van a piacon ami AVX-et használ? ( nagyon kevés ). Szerinted mennyi újkeletű program van amit már nem többszálúra írnak? ( nagyon kevés ). Szerinted a két válasz közös halmaza mennyi programot takar? ( nagyon kevés * nagyon kevés = nagyon nagyon kevés ? )
A hozzászólásod második felében pedig egy olyan dolgot vázolsz ami még tovább csökkenti az egyszálú programok végrehajtási sebességét. ( A #9766-ban ugye erre kérdeztél rá? )
#9772 #95904256 törölt tag Zeratul #9771

Új Válasz 2011-09-23 11:20:50 #9772
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Zeratul #9771 üzenetére

Ehhez kérnék egy kis magyarázatot, mert nem látom az összefüggést...
Van két dolog, a throughput ( áteresztőképesség ) és a latency ( késleltetés) amik szorosan összefüggenek a fizikai korlátok miatt. Az egyszálú teljesítmény esetén ez utóbbi a fontosabb, ezért szólt erről a hozzászólásom. Nem értem miért hangsúlyozod, hogy nőtt a throughput.
#9769 #95904256 törölt tag Zeratul #9766

Új Válasz 2011-09-23 10:53:39 #9769
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Zeratul #9766 üzenetére

Szerintem felejtős, hogy az egyszálú teljesítményben jelentősen jobb legyen a Bulldozer a K10-nél. Sőt, az szinte egyértelmű, hogy clock-to-clock lassabb lesz!
A Bulldozert ugyanis úgy tervezték, hogy minél nagyobb órajelet lehessen elérni. Ennek egyik módja, ha az utasításokat minél egyszerűbb, de több lépcsőben hajtja végre a processzor. Vagyis, megnő az utasítások végrehajtási ideje.
Például a szorzás, osztás, összeadás, gyökvonás, stb. műveletek majd másfélszer tovább tartanak a Bulldozeren, mint a K10-es magon! Ezt persze a másfélszer magasabb órajel kompenzálhatja. Az más kérdés, hogy ennek milyen hatása lesz a fogyasztásra...
szerk.: Megjegyezném, hogy az Intel annak idején Pentium4-es NetBurst-tel hasonlót követett el. De sajnos az egekbe szökő fogyasztás miatt náluk megbukott a dolog.
#9578 #95904256 törölt tag Fail3D! #9569

Új Válasz 2011-09-18 20:50:33 #9578
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Fail3D! #9569 üzenetére

Valószínűsítem, hogy a C0 steppinggel visszább fogják a fogyasztást. Az első steppinges processzorok szokás szerint rendesen kihasználják a TDP limitet. Mivel már régóta a köztudatban van a C0 stepping, így várható, hogy egy kis türelemmel tuningbarát processzorra lehet szert tenni. ( Bár a hírek szerint a B2 se piskóta... )
#9564 #95904256 törölt tag Oliverda #9563

Új Válasz 2011-09-18 13:20:49 #9564
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Oliverda #9563 üzenetére

Az AMD nem erősítette meg, hogy szeptember 19 a hivatalos start?
Egy csomó helyen lehet(ett) olvasni, hogy a B2-esek ekkora rajtolnak...
#9561 #95904256 törölt tag Oliverda #9559

Új Válasz 2011-09-18 11:34:54 #9561
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Oliverda #9559 üzenetére

Oh... én abban reménykedtem, hogy októberben már C0 steppinges Bulldozer tulaj leszek.
#9178 #95904256 törölt tag Lazarus911 #9177

Új Válasz 2011-09-05 18:12:35 #9178
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Lazarus911 #9177 üzenetére

Azért vannak páran akiben már elég jól felgyülemlett a bélgáz...
#9172 #95904256 törölt tag Hakuoro #9170

Új Válasz 2011-09-05 16:09:48 #9172
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Hakuoro #9170 üzenetére

Ez elvileg a júniusi, alaplapgyártóknak szánt roadmap.
Valószínűleg náluk már régebbóta vannak B2 steppinges processzorok...
Olyasvalakitől várnék választ aki ezzel tisztában van.
Oliverda: Akkor még várok egy-két hónapot a vásárlással. Idén már úgy sem lesz időm, hogy alaposan kipróbáljam a Bull-t...
#9169 #95904256 törölt tag

Új Válasz 2011-09-05 15:49:50 #9169
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

Az alábbi ábrának mennyire lehet hinni?
Nem ezek hamisítottak múltkor teszteredményeket?
Ha október végén tényleg itt a C0 stepping, akkor esetleg érdemes megvárni...
#9137 #95904256 törölt tag whiteman0524 #9136

Új Válasz 2011-09-03 15:08:13 #9137
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz whiteman0524 #9136 üzenetére

Attól, hogy 95W-os vagy 125W-os TDP osztályba sorolt FX-8120-ról beszélünk, a mérhető fogyasztásbeli különbség alig pár watt lesz. Szerintem épp ennyivel többe is fog kerülni a 95W-os példány. ( Pl. az Intel processzorok esetében évtizedekben mérhető a megtérülési idő. )
#8972 #95904256 törölt tag whiteman0524 #8969

Új Válasz 2011-08-26 05:41:43 #8972
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz whiteman0524 #8969 üzenetére

Én is pont ezért néztem be.
De csak újabb trollozások...
#8883 #95904256 törölt tag Oliverda #8882

Új Válasz 2011-08-19 22:07:03 #8883
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Oliverda #8882 üzenetére

(#8882) Oliverda: "Logikus lenne ez a kiosztás, mert akkor két teljes modult el lehet küldeni aludni."
Szerintem a Windows szálkezelője ilyet nem tud. Talán még azt sem tudja megmondani, hogy a Feladatkezelő ablakai fizikailag melyik processzormaghoz tartoznak.
#8736 #95904256 törölt tag P.H. #8735

Új Válasz 2011-08-08 21:26:46 #8736
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz P.H. #8735 üzenetére

Az Intel-nél "csak" FMA3 kompatibilitásról beszélnek.
#8731 #95904256 törölt tag Fail3D! #8727

Új Válasz 2011-08-08 20:22:02 #8731
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Fail3D! #8727 üzenetére

Látom nem értetted meg, miért várom a Bulldozert.
Sajnálattal tudatom, hogy sem a Sandy Bridge, sem a későbbiekben megjelenő Ivy Bridge, de még csak a 2013-ban várható Haswell sem lesz FMA4 kompatibilis. Hoppá...
#8726 #95904256 törölt tag Yutani #8725

Új Válasz 2011-08-08 14:59:10 #8726
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Yutani #8725 üzenetére

Bizony-bizony vagyunk páran akik már türelmetlenül várják!
Én leginkább az FMA4-re vagyok kíváncsi.
Remélem letörli a Sandy tulajok képéről a vigyort.
#8587 #95904256 törölt tag bel6 #8586

Új Válasz 2011-07-17 21:19:25 #8587
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz bel6 #8586 üzenetére

A processzorokat viszont maguk gyártják, míg az AMD már nem.
( Global Foundries ~10.000 alkalmazott )
#8584 #95904256 törölt tag Remus389 #8583

Új Válasz 2011-07-17 21:00:51 #8584
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Remus389 #8583 üzenetére

(#8583) Remusz911: "van fogalmad mekkora projekt kifejleszteni egy processzor architektúrát?"
Képzeld, nekem van.
Hogy egy példát felhozzak, nézz utána a Godson / Loongson processzornak. Ennek a processzornak az alaptörténete, hogy a kínai kormány az "amerikai" CPU-függőség elkerülése érdekében indított egy MIPS alapú projektet a kínai tudományos akadémián. A fejlesztéssel-gyártással együtt kb. 200 ember dolgozott rajta. Az utóbbi időben ugyan hízhatott a létszám ( mióta x86 kompatibilissé tették ( Loongson néven )). A jelenlegi 8 magos Loongson 3B becsült teljesítménye 256GFlops, igaz csak 1GHz körüli órajelen.
De akár felhozhatnám a Zilog példáját is. Akkor sem kellett minden tranzisztorra egy mérnököt állítani...
#8581 #95904256 törölt tag Remus389 #8580

Új Válasz 2011-07-17 20:40:27 #8581
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Remus389 #8580 üzenetére

Értetlen vagy. Nem kicsit, nagyon. Az AMD nem kicsi cég. Ha nem akarod felfogni, ne tedd. Legyen a Te bajod.
#8579 #95904256 törölt tag Remus389 #8578

Új Válasz 2011-07-17 20:20:56 #8579
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Remus389 #8578 üzenetére

Ki gondolta volna, hogy a sarki zöldséges nem tervez tranzisztoros áramköröket. Látom az értetlenkedés nálad is alap.
(#8578) Remusz911: "ehhez képest az Intel több mint 10x nagyobb"
Intel: 43.6 milliárdos forgalom, 82.500 alkalmazott.
#8577 #95904256 törölt tag Remus389 #8575

Új Válasz 2011-07-17 20:10:00 #8577
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Remus389 #8575 üzenetére

(#8575) Remusz911: "ilyen kis cég esetén"
Ez a kis cég 7 milliár dolláros forgalmat bonyolított tavaly, 11.100 alkalmazottal.
Összehasonlításképp mondom, hogy a legnagyobb magyar cégként emlegetett ( 15%-ban magyar tulajdonú ) MOL esetében ez 16 milliárd dollár és 32.000 alkalmazott. Tehát az AMD nem is olyan kicsi cég...
#7994 #95904256 törölt tag

Új Válasz 2011-05-29 12:46:48 #7994
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

Olvastam valami olyasmit, hogy a Bulldozer lebegőpontos egysége az integer magokénál alacsonyabb órajelen fog futni. Ez igaz?
#7938 #95904256 törölt tag dezz #7933

Új Válasz 2011-05-20 19:48:01 #7938
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz dezz #7933 üzenetére

Az FPU működésére vonatkozó rész csak találgatás vagy hivatalos infóból származik?
A #7897-ben linkelt ábra szerint 4x64 bites FADD és 4x64 bites FMAC lesz a Bulldozerben. Nem lehet, hogy a modulon belüli két mag külön-külön garázdálkodhat két-két 2x64 bites FADD és FMAC egységekkel? Csak AVX utasítás esetén kellene összefűzni a két egységet. Az általad említett újrafordítós dolog ( két programszál együtt működjön ) ugyanis elég macerásnak tűnik. Ha jól értem, akkor ebben az esetben a programozónak arra is figyelni kellene, hogy a két programszál egy modulon belüli két magra kerüljön futtatáskor.
#7907 #95904256 törölt tag dezz #7906

Új Válasz 2011-05-17 19:22:29 #7907
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz dezz #7906 üzenetére

Akkor sem láttam még.
#7897 #95904256 törölt tag Hakuoro #7871

Új Válasz 2011-05-17 06:58:28 #7897
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Hakuoro #7871 üzenetére

Ez egészen érdekes, még nem láttam eddig ezt az ábrát:
#7507 #95904256 törölt tag #95904256 #7505

Új Válasz 2011-03-22 19:56:40 #7507
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz #95904256 #7505 üzenetére

Szerkeszteni már nem tudtam, de előbb épp édesanyám járt itt. Megkérdeztem, hogy szerinte mi a világ legmagasabb órajelű processzora. Nem értette a kérdést, de végül eljutott oda, hogy beírta a Google-ba. [link]
#7505 #95904256 törölt tag Oliverda #7504

Új Válasz 2011-03-22 19:47:10 #7505
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Oliverda #7504 üzenetére

Szerintem meg nem.
#7503 #95904256 törölt tag kleinguru #7502

Új Válasz 2011-03-22 19:10:52 #7503
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz kleinguru #7502 üzenetére

Szerintem meg senki nem mondta, hogy egyszerű halandó egyszerű lapjáról szólt az alábbi kijelentés: "Már csak 33 MHz-cel van lemaradva az AMD a "valaha kiadott legmagasabb gyári órajelű processzor" címtől."
#7501 #95904256 törölt tag Brae #7495

Új Válasz 2011-03-22 18:07:16 #7501
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Brae #7495 üzenetére

Az IBM z196-ostól még jobban le van maradva... 5.2GHz
#6878 #95904256 törölt tag Tibicsucsu #6877

Új Válasz 2010-09-09 21:09:11 #6878
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Tibicsucsu #6877 üzenetére

Eh... Azt hittem szándékos volt.
1 EUR ~ 286 HUF
#6875 #95904256 törölt tag Tibicsucsu #6874

Új Válasz 2010-09-09 20:21:01 #6875
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Tibicsucsu #6874 üzenetére

286...
#6722 #95904256 törölt tag Yutani #6721

Új Válasz 2010-07-07 20:39:14 #6722
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Yutani #6721 üzenetére

A Netburstnek nem az órajellel volt gondja, hanem a hozzá társuló fogyasztással. Ezt mi sem mutatja jobban, hogy ha "rendesen" hűtik, akkor egészen magas órajelekre képes. A legmagasabb órajel rekordokat még mindig Netburst-ös processzorok tartják.
#6720 #95904256 törölt tag Oliverda #6719

Új Válasz 2010-07-07 17:40:53 #6720
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Oliverda #6719 üzenetére

Hozzátenném, hogy a clock-to-clock meglehetősen kódfüggő.
Ha AMD-re optimalizálnának, akkor az Intel maradna le c2c-ben...
#6714 #95904256 törölt tag zsolt320i #6713

Új Válasz 2010-07-01 13:42:54 #6714
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz zsolt320i #6713 üzenetére

Nem értek veled egyet. A cél mindenütt az, hogy jól legyenek megcsinálva a dolgok. Valamit jól megcsinálni csak akkor lehet ha ráfordítottad a szükséges időt. Rosszul megcsinálni lehet hamarabb is. Ebből szerintem elég egyértelmű, hogy a minél jobban szeretnél valamit megcsinálni annál több idő kell hozzá. Az más kérdés, hogy ki milyen hatékonysággal használja fel az erőforrásokat.
#6712 #95904256 törölt tag zsolt320i #6710

Új Válasz 2010-07-01 12:57:12 #6712
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz zsolt320i #6710 üzenetére

(#6710) zsolt320i: "1. ha fejlesztek nem mindegy hogy milyet fejlesztek, ugyanannyi időbe és munkába kerül egy jót is kifejleszteni meg egy "szart is", szal közel a zs is amit bele kell ölni ugyanaz"
Ezt most viccnek szántad vagy tényleg ennyire homályos a dolog?
(#6710) zsolt320i: "biztos hogy növekedne, a "core" mérete nagyobb az amd magjánál?"
Éppenséggel lehetne fejleszteni olyan technológiát is ami egyben csökkenti a méretet és növeli a hatékonyságot. Ezeket a "kombinált fejlesztéseket" hívják alapkutatásoknak és a világon a legköltségesebb és legidőigényesebb móka. Tehát ha olcsón akarod megúszni, akkor muszáj lesz helyet biztosítani az extra tranzisztoroknak...
#6707 #95904256 törölt tag zsolt320i #6705

Új Válasz 2010-07-01 12:26:17 #6707
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz zsolt320i #6705 üzenetére

AMD-nél jól tudják, hogy nem éri meg nekik a c2c érték javítása.
Néhány lehetséges ok:
- sok pénzbe kerülne a fejlesztés,
- növekedne a magméret
#6662 #95904256 törölt tag Bluegene #6661

Új Válasz 2010-05-27 15:44:38 #6662
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Bluegene #6661 üzenetére

Ez itt olvashatóbb ( nem kell regisztráció ): [link]
#6593 #95904256 törölt tag fLeSs #6592

Új Válasz 2010-03-30 13:33:27 #6593
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz fLeSs #6592 üzenetére

Szerintem az Intel féle HT-nél nincs fő és alárendelt szál. Ha így lenne, akkor az hamar kiderülne egy egyszerű teszttel. Egyszerűen el kell indítani mndkét szálon egy olyan programot ami alaposan kihasználja az erőforrásokat. Ekkor az alárendelt szál jelentősen lassabban futna, de nem így van. Mindkét szál közel egyforma mértékben lassul vissza, ami attól lehet, hogy az erőforrások kiosztása egyenletes. Azaz a két szál egyenrangú.
#6586 #95904256 törölt tag Oliverda #6585

Új Válasz 2010-03-26 20:13:03 #6586
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Oliverda #6585 üzenetére

Köszönöm, hogy összeszedted az infókat!
Ez így valóban más megközelítést sugall, mint ahogy elsőre gondoltam. Érdekes és jelentősen eltérő megközelítése az erőforrások kezelésének az SMT-hez képest.
Kíváncsi vagyok, hogy fog teljesíteni. Szerintem várható, hogy mindig az SMT előtt lesz. A plusz tranzisztorok helyigénye pedig nem lesz túl jelentős. Szóval, jónak tűnik.
#6584 #95904256 törölt tag Oliverda #6583

Új Válasz 2010-03-26 14:04:01 #6584
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Oliverda #6583 üzenetére

Köszönom a tippet! Visszatekertem és elolvastam azt amit a CMT-vel kapcsolatosan találtam, de némiképp homályos maradt a dolog. Olyasmi kép állt össze bennem, hogy a CMT egy programszál egymást követő utasításait lesz képes külön-külön végrehajtó egységeken is futtatni.
Szerintem az SMT bevezetése hatékonyabb lenne, mert már a mostani processzormagok is képesek egy órajel alatt akár 4-5 utasítás végrehajtására. Tapasztalatok alapján a throughput elméleti maximumának további növelése már nem okozna jelentős javulást a valós IPC értékeken. De az is lehet, hogy épp a CMT lényegét nem sikerült megértenem.
#6582 #95904256 törölt tag

Új Válasz 2010-03-26 12:46:03 #6582
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

Sziasztok!
Hol lehet találni arról valami információt, hogy mikor és milyen név alatt dob a piacra az AMD olyan processzort ami hardveresen több szálat képes futtatni egy magon? Amolyan Intel HyperThreading módjára...
#6371 #95904256 törölt tag Bluegene #6369

Új Válasz 2010-01-03 14:10:29 #6371
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Bluegene #6369 üzenetére

(#6369) Bluegene: "tetszik nem tetszik az Intel Atom vadi új fejlesztés"
De áruld már el végre, hogy mitől vadi új az AMD processzorok meg nem...
Attól, hogy nem Pentium a neve és így új sorba írták?
Az Atomot csupa meglévő fejlesztésből ollózták össze.
A K10 -> K10.5 több újdonságot tartalmaz.
#6368 #95904256 törölt tag Bluegene #6366

Új Válasz 2010-01-03 11:57:32 #6368
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Bluegene #6366 üzenetére

(#6366) Bluegene: "az Intel vagy két éve hozott ki alapjaiban új procit(Intel Atom)"
Aztán mi volt benne az új? Azonkívül, hogy rájöttek arra, hogy megéri egy rettenetesen lebutított "olcsó processzort" nagy mennyiségben piacra dobni.
#5342 #95904256 törölt tag Oliverda #5341

Új Válasz 2008-09-02 21:33:49 #5342
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Oliverda #5341 üzenetére

Azért örömmel venném ha pl. az utolsó 2 számjeggyel jelölnék az órajelet, mondjuk 100MHz-es léptékben. ( Pl.: Phenom X4 HD534 )
#5337 #95904256 törölt tag Oliverda #5334

Új Válasz 2008-09-02 20:33:56 #5337
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Oliverda #5334 üzenetére

"Great, so Phenom i11."
#5333 #95904256 törölt tag slett27 #5331

Új Válasz 2008-09-02 18:55:41 #5333
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz slett27 #5331 üzenetére

Szerintem:
Mivel az Athlon nevet is jó ideje használják, így várható hogy a Phenom névtől sem kívánnak megválni. Olyasmire tippelek hogy Phenom 12050, 13050, stb...
Bár ha mégegyszer odaengedik a tűzhöz a nevezéktanos emberüket akkor lehet hogy Pulsar X4 2000++ lesz...
#5326 #95904256 törölt tag csatahajós #5325

Új Válasz 2008-08-31 14:18:53 #5326
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz csatahajós #5325 üzenetére

"De komolyan, az AMD nevezéktanát kitaláló emberkét be kéne zárni"
Én csak átnevezném. Aztán ha megszokta, akkor újra...
#5313 #95904256 törölt tag slett27 #5312

Új Válasz 2008-08-29 10:37:13 #5313
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz slett27 #5312 üzenetére

Ezt a kérdést nem igazán értem. Az IPC-vel minden összefügg. Pontosabban az IPC függ mindentől. Minél több és gyorsabb a körítés, annál magasabbra szökhet az IPC értéke. Persze az átlagos IPC érték sokkal beszédesebb mint a maximum érték, viszont ezt nehezebb mérni, mivel minden program alatt más.
#5311 #95904256 törölt tag slett27 #5307

Új Válasz 2008-08-29 07:05:55 #5311
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz slett27 #5307 üzenetére

Ha ugyanolyan órajelen az 45nm-es gyorsabban futtat le egy programot ( pl. SuperPI 1M teszt ) mint a 65nm-es, akkor biztos hogy nagyobb az IPC is, hiszen ( kb. ) ugyanannyi utasítás végrehajtásához kevesebb időre volt szüksége. IPC = utasítások száma / végrehajtási idő.
Azt pedig már láttuk az előzetes tesztek alapján hogy a SuperPI kb. 10%-kal gyorsabb a 45nm-es magokon. Persze ez lehet hogy csak a nagyobb L3 hatása, de akkor is nőtt az IPC.
#5260 #95904256 törölt tag VaniliásRönk #5259

Új Válasz 2008-08-19 10:19:29 #5260
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz VaniliásRönk #5259 üzenetére

Azért meglepő hogy működőképes SRAM cellák gyártása után még három év mire processzorok lesznek belőle. Persze értem én hogy minősíteni, finomhangolni, utóellenőrizni, tartós tesztelni, stb... kell a dolgokat. De kíváncsi lennék hogy egy ilyen csúcstechnológia esetében melyik az a folyamat amit nem lehet a beleölt pénz mértékével többé-kevésbé arányosan felgyorsítani.
#5250 #95904256 törölt tag Andre1234 #5248

Új Válasz 2008-08-17 14:23:59 #5250
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Andre1234 #5248 üzenetére

Nálunk meg épp az USB-s konverterek nem váltak be, pedig vagy fél tucattal kipróbáltunk. Aztán rászántuk magunkat azokra a dual portos PCMCIA-s kártyákra melyek nem lógnak ki a gépből. Azok mindegyikével ment eddig minden kacatunk ( PLC-k, szervók, szabályzók... ).
A beszerzendő 486-osok listája még elég hosszú ( AMD: SX-33,SX-40,DX2-50,DX2-66BGx; Cyrix: S25,DX2-50 és DX2-66 Writeback hűtőborda nélkül,DX2v50,DX2-66,DX2-80; IBM: DX2-50,DX2-80,DX4-75; Intel: DX25,DX2-40,DX-50,DX2-50,DX2-66(SX955),DX4-75,DX4-100,SX2-50,SL-20,SL-25,SL-33; SGS-Thomson: DX2-40,DX2-50,DX4v100,DX4-120,DX4v120; Texas: SXL-33,SXL2-40/50/60,SXLC-25/33,SXLC2-40/50; UMC: DX2,U5S-SUPER25/33/40,U5SD-25/33 ). Az 5x86-os lista már rövidebb ( AMD: P75+,P100; Cyrix: 120,133; IBM: 75,120; SGS-Thomson: 120 ). Pentiumból jelenleg csak a POPD5V63 érdekel.
#5247 #95904256 törölt tag Andre1234 #5246

Új Válasz 2008-08-17 12:44:18 #5247
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Andre1234 #5246 üzenetére

A soros port tökéletesen pótolható PCMCIA kártyával ( 7ezer HUF körül kapható ).
#5204 #95904256 törölt tag zsolt320i #5203

Új Válasz 2008-08-05 11:20:04 #5204
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz zsolt320i #5203 üzenetére

Szerintem az AMD elsődleges célja most az hogy kilábaljon a bizonytalan pénzügyi helyzetéből. Ehhez célravezetőbb a költségek lefaragása mint a Buldozer minnél hamarabbi piacra dobása. Szerintem...
#5169 #95904256 törölt tag leviske #5167

Új Válasz 2008-07-26 01:13:57 #5169
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz leviske #5167 üzenetére

"A CPU és GPU felépítése teljesen más..."
Ugyanolyan áramköri elemekből épülnek fel. Csak egyik erre a másik arra van kihegyezve. Persze lehetséges hogy ilyen szinten nem tudnak profitálni a másik fél eredményeiből.
#5166 #95904256 törölt tag zlutor #5165

Új Válasz 2008-07-25 18:53:09 #5166
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz zlutor #5165 üzenetére

Én is ismerek olyan világcéget amelyik megvette egyik másik világcég konkurens részlegét, és mégis, egy év után is alig csurog-csöpög az információ a különböző -, nem csak a fejlesztői, de a termelésirányítási - részlegek közt. Gondolom ilyesmire gondolot slett27 is. Persze AMD-vel kapcsolatosan olyan embertől kellene ezt megtudakolni, aki oda bejáratos.
#5154 #95904256 törölt tag Oliverda #5147

Új Válasz 2008-07-24 11:49:32 #5154
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Oliverda #5147 üzenetére

A Via Isaiah (Nano) kapcsán merült fel egyszer hasonló kérdés. Ott az 1MB-os cache lesz 16 utas. Akkor sem tudtuk eldönteni mire lesz igazán jó, de talán P.H. fórumtárs megjegyzése állhat a legközelebb a jó megoldáshoz. Valószínűleg a több processzoros rendszerekben ez jól jöhet. ( Minél több társprocesszor kívánja megcímezni az adott processzor memóriáját, az annál jobban "töredezik". A sokutas cache jobban viseli ezt. )
#5130 #95904256 törölt tag Oliverda #5129

Új Válasz 2008-07-17 15:07:15 #5130
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Oliverda #5129 üzenetére

A "Many Cores" lenyűgözően brutálisan hangzik...
De az 1974 tű sem piskóta.
Vajon a négy csatornás DDR3 memóriavezérlő azt jelenti hogy 4 memória modult kell fizikailag is hozzá társítani?
#5126 #95904256 törölt tag Raymond #5125

Új Válasz 2008-07-15 11:31:49 #5126
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Raymond #5125 üzenetére

Hm, nem tudtam hogy imádják a C2 tulajok a SuperPI-t, illetve az FSB-s összefüggéssel sem vagyok tisztában. ;)
Viszont azt nagyjából tudom mit is csinál a SuperPI. A Gauss-Legendre algoritmus segítségével interpolálja PI számjegyeit, vagyis minden egyes közelítésnél az előző ( vagy kiindulási ) eredményeket használja fel. Ez persze önmagában nem magyarázza a stream jellegű feldolgozást. Ehhez még azt is tudni kell hogy olyan sokjegyű számokat ábrázol a memóriában a program ( bináris formában ), amelyek jóval túlmutatnak a lebegőpontos egység pontosságán. Az ilyen számokat meg csak úgy lehet feldolgozni ha a program egy-egy számcsoportot dolgoz fel egyszerre ( ami befér pl. az FPU-ba ) majd a részeredményeket görgeti magaelőtt. Vagyis szekvenciálisan dolgozza fel az adatokat.
szerk.: Megjegyzem, egyetlen algoritmus kivételével nincs olyan eljárás amivel PI számjegyeit úgy lehetne megkapni hogy ne kelljen tárolni és dolgozni az előző számjegyekkel. De ennek a kivételes algoritmusnak is nő a memóriaigénye a kiszámolandó számjegy pozíciójával összefüggően.
#5123 #95904256 törölt tag Raymond #5122

Új Válasz 2008-07-15 10:32:49 #5123
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Raymond #5122 üzenetére

Jól tudod. Viszont azt a 8MB adatot ciklikusan, stream jelleggel dolgozza fel, így amíg az adatok teljesen be nem férnek a cache-be, addig a memóriavezérlőnek közel ugyanannyi memóriaműveletet kell elvégezni...
#5121 #95904256 törölt tag Oliverda #5119

Új Válasz 2008-07-14 17:45:28 #5121
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Oliverda #5119 üzenetére

Igen, az már könnyebben elképzelhető.
Épp számolgattam hogy ha nálam a Phenom 9600-as 30,2 másodperc alatt végzett 2545MHz-en, 1018MHz-en járó RAM-okkal az 1 megás teszttel, akkor ugyancsak pörögni kellett ott a ferdeszeműeknél valaminek, mert lineáris gyorsulást feltételezve is csak (=30,2 * 2545 / 3484) 22,06 másodperc jön ki, a RAM-ra meg 1394MHz. Ha azt veszem hogy az L3 cache 6MB-ra bővítésén kívül nincs más teljesítményt növelő változtatás, akkor az a +4MB L3 cache, legalább 10% gyorsulást jelent!!!
#5118 #95904256 törölt tag Oliverda #5117

Új Válasz 2008-07-14 17:03:55 #5118
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Oliverda #5117 üzenetére

szép!
De az a 3484MHz-es órajel is...
szerk.: Megjegyzem nem látni a képen a RAM órajelét, csak a 268MHz-es busz órajelet.
#5116 #95904256 törölt tag Sandormaster #5114

Új Válasz 2008-07-14 16:20:01 #5116
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Sandormaster #5114 üzenetére

Egy 1066-os RAM-mal megtámogata... Super PI 1M tutira 20s alá vihető...
#5105 #95904256 törölt tag Andre1234 #5104

Új Válasz 2008-07-06 12:44:23 #5105
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Andre1234 #5104 üzenetére

Annyit tudok mondani hogy többféle technológiai korlát akadályozza ennek a gyártási csíkszélességnek a csökkentését. A következő lépcsőfoknak mérete / értéke mindig egy fejlesztés vagy inkább több részfejlesztés eredménye. Ezeket az értékek úgy választják meg, amit a legújabb technológiával biztonságosan lehessen gyártani. Aztán persze rengeteg idő mire sorozatgyártásra alkalmas gépek lesznek belőle. Lehet hogy addigra a kutatólaboratóriumokban még 1-2 lépcsővel előbbre járnak. Szóval biztos hogy nem úgy jönnk ki ezek az értékek hogy a hasukra csapnak vagy valamiféle matematikai képletből...
#5079 #95904256 törölt tag Madmax81 #5078

Új Válasz 2008-06-27 10:08:04 #5079
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Madmax81 #5078 üzenetére

Nem lesz benne, de ez nem is volt tervbe véve.
#5067 #95904256 törölt tag Madmax81 #5064

Új Válasz 2008-06-26 14:14:11 #5067
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Madmax81 #5064 üzenetére

Ez a TDP = 8W low-power K8 elég új dolog. Ha az idén piacra dobják, akkor rendesen megfoghatják vele az Intel Atom-ot...
#5036 #95904256 törölt tag goodboy007 #5035

Új Válasz 2008-05-22 19:54:21 #5036
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz goodboy007 #5035 üzenetére

Szerintem ez a kérdés nem ebbe a témába tartozik.
Próbáld meg az "azonnali alaplapos kérdések" témában felhozni.
#4998 #95904256 törölt tag dangerzone #4997

Új Válasz 2008-05-16 17:07:28 #4998
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz dangerzone #4997 üzenetére

Az AMD Athlon XP klub a te helyed...
#4988 #95904256 törölt tag band1103 #4987

Új Válasz 2008-05-12 09:03:32 #4988
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz band1103 #4987 üzenetére

Miért van az hogy az AMD cpuinak sokszor a fele vagy a negyedakkora a gyorsítótárja mint az Intel cpuinak?
Felépítésbeli különbség miatt az AMD processzoroknál kevésbé számít a gyorsítótár méretének növelése. Pl. a beépített memóriavezérlő és az exclusive cache szervezés miatt ( egy adat csak egy helyen szerepelhet a gyorsítótárban ).
Nem gyorsítana a cpun ha több lenne?
De igen. Csak ez nem olyan egyszerű hogy megszorzom kettővel...
#4975 #95904256 törölt tag #95904256 #4974

Új Válasz 2008-05-09 20:07:26 #4975
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz #95904256 #4974 üzenetére

Valóban jól előjött a ROB limit. A Phenom-nál (DDR2-1066) különösen látszik a 72 uop-os méret. A Wolfdale-nél (DDR2-800) olyan 105 uop körül látszott meg, a Kentsfield-nél (DDR2-1080) pedig 110 felett. ( K10: 72 uop / Core2: 96 uop ).
#4974 #95904256 törölt tag Balala2007 #4973

Új Válasz 2008-05-09 17:18:32 #4974
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Balala2007 #4973 üzenetére

Szép...
...és logikus.
Most hazarobogok és kipróbálom újra.
Rettentő nagy baromságnak tűnik amit leírtam.
#4953 #95904256 törölt tag Rive #4952

Új Válasz 2008-05-01 17:46:19 #4953
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Rive #4952 üzenetére

Ez szép, de gyakorlatban hány utasításnyi hosszra szoktak elhúzódni az alapblokkok? 3-5? 10? Meg hány utasítás forog egyszerre feldolgozás alatt? Tipikusan néhány tucat? A SUN-féle megoldás azért új, mert ennél jóval nagyobb távokról is szó lehet, a dolog nincs a VÁ hosszához kötve.
Bevallom ezt nem egészen értettem. Mit értesz alapblokk alatt? Egy mag (AMD/Intel) egyszerre egy-öt utasítást képest feldolgozni, de az ICU/ROB-ban egyszerre 20-30 x86-os utasítás fér el. Ha az egyik várakozik, attól még az ICU/ROB képes új utasításokat fogadni. Mi itt a kritikus dolog?
A SUN-féle megoldás becsapós. Mivel in-order így egyszerre csak egy utasítást hajt végre, ha az várakozásra kényszerül akkor a kisegítő szál képes foglalkozni egy második utasítással. Ha az is megakad, akkor nincs tovább, akkor bizony várni kell. Az AMD/Intel megoldás esetén pl. ha az ALU és a FADD foglalt, akkor még mindig lehet memóriaműveletet végezni vagy éppen a FMUL-t bizgetni.
Egyszerűen nem látom hogy hol jön össze előny az AMD/Intel megoldáshoz képest. Illetve az látszik hogy kevesebbet fogyaszt, de a scout-thread-es dolog csak félig-meddig pótolja az out-of-order vezérlőt.
#4951 #95904256 törölt tag Rive #4950

Új Válasz 2008-05-01 16:55:11 #4951
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Rive #4950 üzenetére

Előbb kipróbáltam ezt a cache-miss dolgot egy Phenom-on és egy Wolfdale-en is. Mindkettő képes volt arra hogy amíg a cache-miss miatt bejön a RAM-ból a dolog addig több száz utasítást ( add, xor, inc, fld, fstp, ... ) végrehajtsanak, így a több száz utasítással és azok nélkül is ugyanannyi volt a futásidő.
Majd kerestem egy UltraSparc T1 leírást, amiből kiderült hogy ez a processzor in-order végrehajtással rendelkezik, de képes arra hogy pl. egy cache-miss-nél egy másik szálon (scout-thread) tovább futtassa a további utasításokat. Kvázi out-of-order végrehajtást csinál úgy hogy befog egy másik egységet a feladatra.
Ez akár egy működő példa is lehet fLeSs által is felvázolt több mag közti utasítás szétosztásra.
#4949 #95904256 törölt tag Rive #4947

Új Válasz 2008-05-01 15:19:21 #4949
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Rive #4947 üzenetére

Hm... A vastagon kiemelt részeket dokumentáció vagy analízis alapján mondod?
Próbáltam utána keresni a Niagara benchmark értékeinek, de csak ilyesmit találtam. Ezek szerint a Niagara nem tűnik csodának, bár a fogyasztása kétségtelenül a legjobb. Ebből viszont arra következtetnék hogy amennyira csak lehet kerüli a plusz munkát. Már pedig a "néhány ezernyi utasítás" becslésen alapuló előfeldolgozása ugyancsak tranzisztor melengető dolognak tűnik...
#4946 #95904256 törölt tag Rive #4945

Új Válasz 2008-05-01 13:27:10 #4946
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz Rive #4945 üzenetére

Ha jól tudom az AMD és az Intel processzorai is képesek spekulatív végrehajtásra és az ugrás előrejelezésük is meglehetősen jó hatásfokú, akkor felmerül a gondolat hogy a Niagara árnyék-szálai ugyan előrelépést jelentenek, de vajon nem csak elenyésző mértékben?
#4943 #95904256 törölt tag zlutor #4942

Új Válasz 2008-04-30 23:31:18 #4943
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz zlutor #4942 üzenetére

En csak annyit akartam mondani, hogy az Inteles HT megoldas nem futtat gyorsabban egyszalas progit attol, hogy ugy tunik, mintha ket proci lenne. Ami ugye raadasul nem is ketto, csak 1,x...)
Értelek. Egy trabantba se tudsz gyorsabban beszállni attól hogy két ajtaja van...
#4939 #95904256 törölt tag P.H. #4938

Új Válasz 2008-04-30 22:37:42 #4939
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz P.H. #4938 üzenetére

Ennek kivédése azért még nem radikális áttervezés: a jelenlegi AMD-microarchitecture-ban is elfér egy macroop-okat tartalmazó loop stream detector
Ezért is mondtam hogy: #4927
#4936 #95904256 törölt tag P.H. #4934

Új Válasz 2008-04-30 22:17:47 #4936
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz P.H. #4934 üzenetére

A ugrások találati arányát ( nekem 95% feletti átlagok rémlenek ) nem is firtatom. De azért bosszant hogy AMD-nél minden egyes ugrásnál +1 órajellel számolhatok. Ez egy átlagos kód esetén több százalékkal (~ 0-10%) lassabb futást is eredményezhet.
#4935 #95904256 törölt tag zlutor #4933

Új Válasz 2008-04-30 22:05:37 #4935
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#95904256

törölt tag

válasz zlutor #4933 üzenetére

Attól hogy azt mondom "Intel féle hyperthreading" az nem azt jelenti hogy fele annyi erőforrás, mint a nem Intel féle megoldás.
Mivel az X2-esed kétszer annyi erőforrással rendelkezik mint az Intel processzorod, így nem csoda ha egy erősen párhuzamos feldolgozást végző algoritmus kétszer gyorsabb fut rajta. Vagy tévedek?

Új hozzászólás Aktív témák

Téma tudnivalók

A topikban az OFF és minden egyéb, nem a témához kapcsolódó hozzászólás gyártása TILOS!

Az ide nem illő hozzászólások topikja:[link]

MIELŐTT LINKELNÉL VAGY KÉRDEZNÉL, MINDIG OLVASS KICSIT VISSZA!!

A topik témája:

Az AMD éppen érkező, vagy jövőbeni új processzorainak kivesézése, lehetőleg minél inkább szakmai keretek között maradva.

Aktív témák

Új fizetett hirdetések

Üzleti előfizetők hirdetései

Állásajánlatok

Számítástechnikai értékesítő

Cég: Laptopműhely Bt.

Város: Budapest

Részletek