-
Fototrend
OLVASD VÉGIG ALAPOSAN MIELŐTT ÚJ HOZZÁSZÓLÁST ÍRNÁL!!!
Új hozzászólás Aktív témák
-
robyeger
addikt
válasz
#95904256
#1794
üzenetére
-Azt hogy pl. egy SSE utasítás miként terheli a magokat (milyen mikroutasítások sorozataként hajtja végre a proci) nem tudod befolyásolni, hiába DOS alatt futatod az x86-os utasításaid.
-A magasabb órajel azért kell, hogy a különböző alapórajel és szorzó beállítások között markánsabb transzfer teljesítmény különbség képződjön. Látványos különbségek kellenének, hogy a ''vakok'' számára is tagadhatatlan legyen
-
#95904256
törölt tag
válasz
robyeger
#1790
üzenetére
Két mag esetén már a Win2000 is képes arra hogy terhelés szerint ossza ki a magokra a feladatokat, így míg az egyik magon futnak a Windows dolgai, addig a másikon futhat a teszt jóval kisebb mérési hibával mint ha egy magon futtatnám a Windows-t. Ezt már egyszer próbáltam és az eredmények ezt támasztják alá.
Egyébként interrupt maszkolt DOS-t (Win98?) kívánok használni a teszthez. Ami egyébként garantálja hogy a második mag cseppet sem fog zavarni.
robyeger: másodsorban a 2Ghz elég kevés
Miért is? A teszt nincs időhöz kötve. Legfeljebb tovább fog tartani. Sőt, ha egy mérés idejét minél nagyobbra veszem annál pontosabb eredmény kapok. Én meg nem sietek. Ráadásul így biztosabb hogy a RAM nem lesz szűk keresztmetszet.
[Szerkesztve] -
robyeger
addikt
válasz
#95904256
#1789
üzenetére
Hali! Őszintén szólva majdnem a lehető legrosszabb választás ez a proci a teszt szempontjából, először is 2magos és mi 1magra, tehát 1db L2 cache-re szeretnénk vizsgálódni, hiába az affinitás álíthatósága a win alkalmazásokra, sok összetett utasításnál a proci szuverén joga meghatározni a feladatok kiosztását, pl. ezért BIOS szinten se tiltható le a másik mag, másodsorban a 2Ghz elég kevés. A teszt szemponjából az a legjobb, ha minél magasabb az órajel, ezért AM2-nél az Orleans magos 2.4Ghz-es Athlon64 3800+ tünik jó választásnak.
De hangsúlyozom miattam nem kell 1magos procit venned

Mindenkinek: Egyenlőre úgy néz ki nem lesz időm a topic-okat olvasni, ezért ha valaki nyilvános hsz-t intéz hozzám, kérem, hogy a hsz link-jét privát üzenetben is küldje el részemre, előre is köszönöm!

-
#95904256
törölt tag
-
shabbarulez
őstag
Kíváncsi leszek a Larrabeehoz rak-e és milyen újabb SSE kiegészítést az Intel. Túl sokat nem lehet róla tudni, csak annyit hogy egy egyszerűsítettebb általános céló x86 magokból fog állni, kiegészítve olyan utasításokkal amit a GPGPU képességekhez kellenek. Ott meg azért elkellene a 3 oprendusos utasításkészlet. Lehet az Intelnek lesz egy saját SSE6-ja vagy SSE5 de más tartalommal hogy még tovább bonyolítsák a fejlesztők életét. Aztán idővel 32nm-nél majd az is átsziváros az általános célú magokba.
-
drkbl
őstag
Talán nem nagyon OFF: SSE háború kezd körvonalazódni [link]
A közeljövőben markánsan különbözni fog az Intel és AMD processzorok alkalmazási köre (legalábbis ott, ahol nem az ár az elsődleges)? Lehet erről valahol bővebben olvasni? -
Andre1234
aktív tag
válasz
VaniliásRönk
#1783
üzenetére

Egy ellenforradalmár véleménye..

Úgy érzem nem először beszélgettek.na jól van, én sem leszek önjelölt moderátor.
Vissaztérek kussba mielőtt még vki rámküldi vírus hadseregét..:

-
dezz
nagyúr
Na itt vannak az első (BIOS frissítés által) AM2+ kompatibilissá tett meglévő alaplapok az ASUS-tól (bővül a lista!): [link]
eXodus: Lehet, hogy egy Quad-SLI-s PCIe2.0-s konfignál már kezd majd számítani...
Na jó, meg talán akkor is, ha túl kevés a vram, és a GPU a main ramból olvassa a textúrákat (ami inkább csak az ilyen 32-64 megás TurboMemory, és AMD-s megfelelőjével fordulhat leginkább elő
). Illetve esetleg ha jobban bejön a fizika is.
Most nincs időm számolgatni, de meg lehetne nézni, hogy a HT3.0 sávszéle hogy aránylik a PCIe-hez, 1.1 és 2.0 esetén.
Joshi: Hisztit? LOL. Mintha te kezdtél volna hisztizni, hogy miért tud majd többet az új proci egy új alaplapban, vagy talán arra gondoltál, hogy a régi alaplapok miért nem táltosodnak meg, és tudják az új fícsöröket is.
[Szerkesztve] -
eXodus
őstag
Teszteltem a ht visszvételt.

Tuning nélkül.
Supreme Commander UGYAN OLYAN eredményt ért el 5x200 és 2x200 as HT mellett. (minden más beállítás ugyan az volt.)
(supcom kihasználja a 2magot,hang is volt, egyéni beállítások mellett)
everest is ugyan olyan eredményt ért el. Egyik FPU testben 1,2%os csökkenés volt -
Joshi
titán
Na, a nagytudású barátaink megtaláltak.

-
Joshi
titán
''AM2 és AM2+ között valami különbségnek lennie kell, egyébként nem adtak volna más jelölést neki.''
Ez részemről nem kérdés volt, erröl ennyit.
''de gondolom alacsonyabb órajelen is üzemelni fog''
Ezt pedig a HT link sebességére értettem. Természetesen az hogy kihasználja vagy nem az Agena, Kuma a HT3.0 sávszélességét, azt inkább had mutassa meg a gyakorlat.
ui.: vagy te már most tudod? Esetleg keresztapud az AMD dolgozója?![;]](//cdn.rios.hu/dl/s/v1.gif)
-
dezz
nagyúr
válasz
Zeratul
#1765
üzenetére
3DMark05? Ez most valami új? Vagy a korábbi sztori továbbmondás közbeni elhallások által módosult variációja?
Ja, látom, az a nagyokos bluetooth... Ehh, ilyen alapon (hétköznapi eredmények) akár a 05-ös, akár a 06-os Top10 eredményeket is ''túl magas''-nak lehetne mondani...
Zeratul: Hát ja, de még akkor is hülyeség lenne, ha a 2db-bal nézték volna a hétköznapi eredményeket...
Egyébként hol vannak a 05-ös Top10 eredmények a Futuremarknál? Vagy ott már nincsenek? -
dezz
nagyúr
válasz
Zé_Mester
#1763
üzenetére
De igen, a szept.10-én debütáló Barcelona többutas szerverekbe szánt proci (Opteron 2xxx és 8xxx), ami Socket F-es, azaz nem jó az AM2/AM2+ lapokba. Valamivel később jönnek majd az 1-utas Budapest magos Opteronok, nos ezek elvileg már AM2+ tokosak, így már jók lesznek (ha lesz BIOS támogatás is). Azt nem tudom, mi a különbség ezek között és az AM2+ tokos 4-magos Phenom procik (egyes FX-ek és az X4) között, amik nov.-dec.-ben jönnek, egyes 2-magosokkal együtt.
-
Oliverda
félisten
A jelenleg forgalomban lévő ASUS lapok amelyek majd elboldogulnak a Phenom procikkal: [link]
-
ftc
nagyúr
There are some reports claiming that Phenom X4 reaches 30,000 in 3Dmark05. That is way too high.
From our observation, a HD2900XT paired with a X6800 (2.93GHz) will only give you a score of close to 18000. How could it be possible for it to reach a score of 30000 ?? Even if it is o/c to 3 GHz, I doubt it would give you that kind of score as 3Dmark05 is not so dependent on CPU, rather it depends more on GPU.
ocw -
Zé_Mester
őstag
válasz
#95904256
#1762
üzenetére
hali
bocsa hogy idefirkálok, csak egy röpke kérdés
próbáltam végigolvasni az összes hozzászólást, de nekem olyan némelyik mintha héberül lenne. ennyire nem értek a procikhoz, úgyhogy ebbe a részébe nem is akarok belerondítani.
kérsésem : eldöntöttem hogy eladom a nemrég megbett Core2Duo-s gépemet és összegyúrok egy ilyen K10-es rendszerre.
azt szeretném megtudni hogy ebből mikorra lehet egy gépet összerakni? az OK hogy szept.10-én debütál a Barcelona, de alaplap mikorra lesz hozzá?
kérdésem még hogy az első procik 4 magosak lesznek??? és árba kb mennyi lenne majd? (tudom hogy most még minden homályos, meg tényleg nincs semmi infó,de úgy kb mégis)
és ugye amik most fognak megjelenni procik azok ugye nem a szerver oldalra jelennek meg??? mert valahol olvastam ilyet , hogy először azok fognak
válaszodat előre is köszönöm
(ha esetleg más is tud ezzel kapcs. valamit, az is érdekel !!!
[Szerkesztve] -
dezz
nagyúr
válasz
#95904256
#1757
üzenetére
''Na, ne bosszants...''
Ezt én is szeretném kérni tőled.
''A SIMD utasításoknak csak egy része lebegőpontos, amelyeket ugyanaz az FPU hajt végre mint amelyik az x87 utasításokat. A másik része meg nem lebegőpontos és ezeket nem az FPU hajtja végre. Pl. ez utóbbiak közé tartozik az SSSE3 és az SSE4 utasítások.''
Úgy tűnik, te Intelben gondolkodsz, én meg AMD-ben...
AMD-nél ezeket is az FPU (= a közösen ''FPU''-nak címkézet részek) csinálja. Nos én meg ezeket ajánlom a figyelmedbe: [link], [link]
Amúgy, oké, az SSSE3 full integer, azonban az SSE4-ben van pár utasítás, ami alapvetően FP-s kódban is felhasználható.
''Ezt a hozzászólást olvastad? : [link]''
Ez a kérdés ''nem volt szép'' - hát persze, hogy olvastam. Miért nem inkább azt írod, hogy pl. ''nyilván valamilyen oknál fogva túlnyomórészt azokat a dolgokat használta a teszt, amit a K10 csinál jobban, és tartózkodott azoktól, amit a Core uarch.''? Bár ez nem valószínű, mivel nyilván valami ipari tesztet futtattak, másra magasról tenne mindenki.
''ps: A megszólítottat azért írom oda és emelem ki vastagon mert olvashatóbbá teszi a szöveget. Az általad használt megoldás nehezebben átlátható, legalábbis nekem biztosan. Feltételezem másnak is.''
Akkor szerinted miért ez a bevett gyakorlat itt a PH-n?
[Szerkesztve] -
#95904256
törölt tag
akosf:''Ugyanis az FPU-ról volt szó...''
dezz:Igen, és? Most beszéltük meg, hogy a SIMD is az FPU-hoz tartozik.
Na, ne bosszants...
A SIMD utasításoknak csak egy része lebegőpontos, amelyeket ugyanaz az FPU hajt végre mint amelyik az x87 utasításokat. A másik része meg nem lebegőpontos és ezeket nem az FPU hajtja végre. Pl. ez utóbbiak közé tartozik az SSSE3 és az SSE4 utasítások.
Ajánlom figyelmedbe ezt az ábrát: [link]
A port0, port1, port2 körül nézelődj...
dezz:Szerinted ha így gondolnám, miért emeltem ki minden esetben, hogy ebben a tesztben? Akkor a kérdés kicsit szájbarágósabban: hogy lehetne akár 1 tesztben 50%-kal gyorsabb FP műveletekben a K10, ha valójában lassabb FP műveletekben?
Ezt a hozzászólást olvastad? : [link]
ps: A megszólítottat azért írom oda és emelem ki vastagon mert olvashatóbbá teszi a szöveget. Az általad használt megoldás nehezebben átlátható, legalábbis nekem biztosan. Feltételezem másnak is.
Az OFF-tag használatát épp ezért használtam, de látom egyeseket zavar. Átgondoltam a dolgot. Tiszteletlenségnek tűnhet hogy valakit ''OFF''-ban idézek, így a jövöben ezt nem teszem. Köszönet a szemléletkiigazításért...
ps2: ... -
dezz
nagyúr
válasz
slett27
#1753
üzenetére
''az Intel 2009-ben integrálja a memvezérlőt''
(Állítólag nem minden szegmensben.)
''lehet AMD túl korán tette, feleslegesen, vagy vmit nem tudott megoldani talán ?''
Alapvetően azért volt rá szükségük, mert vonalszélességben állandóan le vannak maradva (az összes piaci szereplőhöz hasonlóan, lévén az Intel van ebben az élen), így csak jóval kevesebb L2-vel gazdálkodhattak. (A cache ugyebár a memóriahozzáférést igyekszik kiváltani.)
De megközelíthetjük máshonnan is: a P4 IMC nélkül is sokat fogyasztott, így az nem fért volna bele a keretbe. Ezért ráálltak a minnél nagyobb L2-re (megtehették - bár ez náluk sem ''ingyen'' adatik meg, hiszen nagy ferületet visz el), hogy ennek hiányát kompenzálják. Core2-nél is rontotta volna a fogyasztási mutatókat a dolog, ezért itt is a cache-növelési stratégiát vitték tovább. A Nehalemnél viszont már nem halaszthatják tovább a lépést.
''Vagy a Compaq-Alpha buszrendszer elavult a GTL-hez képest (ez kizárt amúgy ).''
Mármint a HT-nél? Nem, egyátalán nem elavultabb, de nem emiatt kellett az IMC.
''Mert ugye a Core2 architektúra IMC nélkül is gyorsabb mint az X2 IMC-vel, akkor miért jönnek egyesek a RAM sávszéllel, meg hogy Integrált memvezérlő ilyen megy olyan hűdejó.''
Hát jó is, hiszen részben ezáltal nyert a P4-gyel szemben (alacsonyabb memória-késleltetés). Sávszélben a Core2 is gyengébb, mint a K8, csak ez nem sokat ér, ha a mag jóval gyengébb, és így nem igazán tudja kihasználni. Azonban K10-nél az eddiginél is nagyobb memsávszél és eddiginél is alacsonyabb átlagos késleltetés erős maggal fog párosulni.
[Szerkesztve] -
slett27
addikt
Pont lejárt az időlimit a MOD hoz.

akosf, dezz : az Intel 2009-ben integrálja a memvezérlőt, ez nem lehet véletlen, lehet AMD túl korán tette, feleslegesen, vagy vmit nem tudott megoldani talán ? Vagy a Compaq-Alpha buszrendszer elavult a GTL-hez képest (ez kizárt amúgy
). Mert ugye a Core2 architektúra IMC nélkül is gyorsabb mint az X2 IMC-vel, akkor miért jönnek egyesek a RAM sávszéllel, meg hogy Integrált memvezérlő ilyen megy olyan hűdejó. -
slett27
addikt
-
dezz
nagyúr
válasz
#95904256
#1749
üzenetére
''Kellett volna?''
Hát már hogy ne kellett volna, ha - természetesen - minden lényegeset fel akarsz sorolni...?
''Egyébként nem hiszem hogy ezektől kapna szárnyra a Penryn FPU-ja.''
Hát már hogy ne, ha egyszer így bizonyos műveletek gyorsabban elvégezhetők?
''Ugyanis az FPU-ról volt szó...''
Igen, és? Most beszéltük meg, hogy a SIMD is az FPU-hoz tartozik.
''Ennek már elég nehéz meghatározni az FPU-ra gyakorolt teljesítményét.
Szerinted mennyire jelentős? Egyébként nem említettem a beépített memóriavezérlőt sem.''
Éppen most írtam le, hogy nem tudom, ez mennyit számít, de az AMD az FPU-val kapcsolatban emlegette, és hogy ezért írtam ide.
''Igen, arra. Ennél egyértelműbb kapcsolatot nem is lehetne találni.''
Oké, csak nem voltam benne biztos, ezért megkérdeztem.
''Vagy te miben mérenéd az utasítások végrehajtási sebességét?''
Az egyes utasítások végrehajtási idejét nyilván ebben. Mondjuk nem csak ez számít.
''Aki akarja futtassa csak ezt a tesztet és gyönyörködjön benne hogy 50%-kal gyorsabb a K10. Szerintem még mindig feladat függő hogy mikor melyik CPU szerepel jobban. Vagy úgy gondolod hogy ezt az 50%-ot minden másban is hozni fogja?''
Szerinted ha így gondolnám, miért emeltem ki minden esetben, hogy ebben a tesztben?

Akkor a kérdés kicsit szájbarágósabban: hogy lehetne akár 1 (spec-féleség, de nem túl spéci
) tesztben 50%-kal gyorsabb FP műveletekben a K10, ha valójában lassabb FP műveletekben?
ps. a megszólított (boldos) kiemelése csak akkor szükséges, ha másnak is válaszolsz egy hsz-en belül. Az OFF tag használatát meg érdemes lenne meghagyni az OFF dolgoknak...
[Szerkesztve] -
#95904256
törölt tag
dezz:Hmm, akkor miért nem említetted a Penrynnél az SSE4-et? Illetve a már Core2-nél is meglévő SSSE3-at (pl. shuffle-k).
Kellett volna? Ez legyen a te dolgod.
Egyébként nem hiszem hogy ezektől kapna szárnyra a Penryn FPU-ja.
Ugyanis az FPU-ról volt szó...
dezz:Vagy K10-nél a 256 bites elérésű L1i-t.
Ennek már elég nehéz meghatározni az FPU-ra gyakorolt teljesítményét.
Szerinted mennyire jelentős? Egyébként nem említettem a beépített memóriavezérlőt sem.

akosf:A legtöbb SIMD utasítás lassabb K10-en mint Core2-ön.
dezz:Ezt mire alapozod? Az utasítások latency értékeinek összehasonlítására?
Igen, arra. Ennél egyértelműbb kapcsolatot nem is lehetne találni.
Vagy te miben mérenéd az utasítások végrehajtási sebességét?
dezz:Mindenesetre, nem tudom, ez hogy lehetne, ha egyszer a Core2 jóval kevesebb, mint 2x olyan gyors, mint a K8, miközben a K10 kb. 2x gyosabb lesz SIMD-ben, mint a K8. Meg ugye itt van ez a bizonyos teszt, amiben 50%-kal gyorsabb azonos órajelen a K10, mint a Core2 - ez mitől lehet akkor?
Aki akarja futtassa csak ezt a tesztet és gyönyörködjön benne hogy 50%-kal gyorsabb a K10. Szerintem még mindig feladat függő hogy mikor melyik CPU szerepel jobban. Vagy úgy gondolod hogy ezt az 50%-ot minden másban is hozni fogja? -
dezz
nagyúr
válasz
#95904256
#1747
üzenetére
Hmm, akkor miért nem említetted a Penrynnél az SSE4-et? Illetve a már Core2-nél is meglévő SSSE3-at (pl. shuffle-k).
Vagy K10-nél a 256 bites elérésű L1i-t (bár nem tudom, ez mennyit számít - de gondolom, nem véletlenül csinálták, és emlegetik elsősorban az FPU-val kapcsolatban).
''A legtöbb SIMD utasítás lassabb K10-en mint Core2-ön.''
Ezt mire alapozod? Az utasítások latency értékeinek összehasonlítására?
Mindenesetre, nem tudom, ez hogy lehetne, ha egyszer a Core2 jóval kevesebb, mint 2x olyan gyors, mint a K8, miközben a K10 kb. 2x gyosabb lesz SIMD-ben, mint a K8. Meg ugye itt van ez a bizonyos teszt, amiben 50%-kal gyorsabb azonos órajelen a K10, mint a Core2 - ez mitől lehet akkor? (A natív 4-magosság és a L3 önmagában nem igazán lenne elég ahhoz, hogy a lassabból másfélszer gyorsabbat csináljon [kivéve, ha befér az egész kód+adatok a cache-ekbe, de a specFP-kre, és társaikra ez nem jellemző].)
[Szerkesztve] -
#95904256
törölt tag
dezz:#1739: Gondolom, itt az x87 kódra gonolsz (régi v. új regiszterekkel), mert a SIMD kód végrehajtása is az FPU dolga.
Nem. FPU alatt értettem itt az x87 és SSE műveleteket is.
Épp azért ahogy írtad is: SIMD kód végrehajtása is az FPU dolga
A legtöbb SIMD utasítás lassabb K10-en mint Core2-ön. -
slett27
addikt
akosf :
a kimerítő választ
dezz: már megint rosszul számoltam.
Remélem az FPU erőssége megmutatkozik játékokban, nekem az lenne a fontos.
-
dezz
nagyúr
A linkedre kattintva nekem nem indul el semmi ''magától'', de feltételezem, a ''CPU face off: AMD Opterons vs. Intel Clovertown'' videora gondolsz. Nos, akkor olvasd csak el a #1738-ast...
Egyébként a specFP, illetve a többi ipari szabvány tesztprogram nem csak sima x87 kód (mint pl. a SuperPI), hanem az egész procit, sőt a memóriát is igénybe veszi.
[Szerkesztve] -
dezz
nagyúr
válasz
#95904256
#1733
üzenetére
Ez kifelejtettem. Már most ki lehet próbálni, mennyit számít a HT: nyomjatok egy tesztet úgy, hogy visszaveszitek a HT szorzóját. 800MHz vs. 1000 MHz még kb. semmit sem számít.
#1739: Gondolom, itt az x87 kódra gonolsz (régi v. új regiszterekkel), mert a SIMD kód végrehajtása is az FPU dolga.
Nos, szerintem 1-szálas x87-ben kb. egálban lesznek, vagy akár a Core még gyorsabb is lesz ebben (az állítólagos SuperPI és Cinebench eredményeket nézve). Többszálas esetben viszont a natív design és a közös L3 sokat dobhat a dolgokon K10-nél.
SIMD-ben jóval gyorsabb lesz a K10, mint a Core2, viszont nagy kérdés, hogy alakul a K10 vs. Penryn eset. Ugyan SSE3-ig itt is gyorsabb lesz a K10, azoban SSE4 használatánál már esetenként szépen elhúzhat a Penryn.
[Szerkesztve] -
#95904256
törölt tag
válasz
slett27
#1737
üzenetére
Szerintem FPU teljesítményben lesz egy kis előnye a K10-nek, de nem sok.
K10 FPU előnyei:
- egyszerre indított szorzás és összeadásnál lehet két memória operandus
- nem illeszkedő memória operandusok kezelése (128 bit)
- gyorsabb szorzás (dupla pontosságnál)
- gyorsabb négyzetgyökvonás
- gyorsabb sin/cos számítás
- gyorsabb hatványozás ( ez nem 100% )
Penryn FPU előnyei:
- gyorsabb összeadás
- gyorsabb komparálás
- gyorsabb osztás
- gyorsabb valós <-> egész konverziók (SSE, FIxxx)
- gyorsabb tanges képzés
[Szerkesztve] -
dezz
nagyúr
''AM2 és AM2+ között valami különbségnek lennie kell, egyébként nem adtak volna más jelölést neki.''
Szótár->visszafelé kompatibilitás.
Különbségek:
AM2: single power plane, HT1.0
AM2+: split power planes (külön fesz a magoknak és az IMC/NB-nek), HT3.0
''Az AM2 HT link sebessége biztosan szűk keresztmetszet lesz a Phenomnak''
Már miért lenne az? Most ki tudod használni fullosan akár a HT1.0-át? (Ugye tudod, hogy a memória-elérésben ez nem számít?)
''de gondolom alacsonyabb órajelen is üzemelni fog''
''viszont így nem kapunk teljes értékű processzort''
LOL, miért, ha eleve AM2 lenne, akkor többet tudna???
Miért baj, hogy újabb alaplapban 1-2 új fícsör is lesz?
7600GT: BIOS frissítés kell majd, más nem.
slett27: Szerintem 2 vs. 2,3 GHz esetén 30% az azonos órajelen több, mint 30%.
Egészen pontosan (78/60) * (2,3/2) = 1,495 -> tehát 50%-kal gyorsabb azonos órajelen (ebben a tesztben)...
Gondolom, ez valami specFP, vagy más ipari szabvány teszt, nem csak egy in-house hack.
[Szerkesztve]
[Szerkesztve] -
slett27
addikt
Ez alapján a teszt alapján (foglalmam sincs milyen FPU-t tesztelő programmal teszteltek
), a nyers számításban a Barcelona előnye azonos órajelen kb 30%. A Penryn átlagban 10-15%-al lesz gyorsabb a Core2-nél, tehát 30-15=15% gyorsulás ? 
Ismét csak találgatás, de ha ez igaz ez kevés lesz.
Amúgy az ár is legalább annyira fog dominálni, mint a sebesség, fogyasztás ~10W különbség azonos kategóriájú prociknál, hmmm, hát nemtudom, harmadlagos... 
[Szerkesztve] -
Joshi
titán
-
rauschie
senior tag
válasz
Hakuoro
#1726
üzenetére
tiszta.
de a k10 kétmagon vajon gyorsabb lesz? mert a nagy pénzeket tuti hogy az intel sem a kentsfieldből szakítja, inkábbcsak(''csak''??) presztizskérdés. nem értek a processzorokhoz, de azt mindenki tudja, hogy a k10nek ütnie kell, mert ha nem akkor gondok lehetnek. azonos órajelen +10% akár elég lenne, csak ugye az intel köztudottan jóval tőkeerősebb cég és nekik nem lenne akkora érvágás árakkal korrigálni a teljesítmánykülömbséget mint most az amd-nek. -
rauschie
senior tag
a k10 kétmagon gyorsabb lesz a c2nél?
mármint ugye a natív négymag előny, de a kétmag az intelnél is natív?
persze nem tudni semmit még, de mire lehet számítani? -
Hakuoro
aktív tag
-
Thrawn
félisten
-
dezz
nagyúr
válasz
#95904256
#1720
üzenetére
Tegyük hozzá, a kitevő ''biased'', és a mantissza helyett itt ''significand'' van (vagy legalábbis itt annak hívják).
1.5 16-Bit Floating-Point Data Type
SSE5 introduces a new 16-bit floating-point data type and two instructions (CVTPS2PH and CVTPH2PS) to convert 16-bit floating-point values to and from single-precision format.
The 16-bit floating-point data type, shown in Figure 1-4 on page 8, includes a 1-bit sign, a 5-bit exponent with a bias of 15 and a 10-bit significand. The integer bit is implied, making a total of 11 bits in the significand. The value of the integer bit can be inferred from the number encoding. Table 1-10 on page 8 shows the floating-point encodings of supported numbers and non-numbers. -
dezz
nagyúr
Közben - ha jól - látom, hogy shuffle csak az SSSE3-ban van, ami (szintén) nincs AMD vonalon. Úgy tűnik, SSE3-ig tartott a kompatibilitás ezen a téren, most meg már eleve külön utakon indulnak el. (Bár még nem hasonlítottam össze az SSE4-et és 5-öt, hasonlítanak-e valamennyire.) Ja, egyébként több SSE4 utasítás is 3 operandusos, csak a 3. operandus mindig az XMM0, nem választható, így nem szerepel a szintaxisban.
[Szerkesztve] -
#95904256
törölt tag
-
dezz
nagyúr
válasz
#95904256
#1712
üzenetére
Na ebben igazad van, jobban megnézve (amit időközben én is megtettem
) tényleg ott van az a ''2nd unit'' is. Akkor tehát arról van szó, hogy a sárga keretből ezt véletlenül kihagyták. 
#1713: Lehetséges. Bár fura, hogy nem egy-egy nagy, 128 bites egység van, hanem 2x 2db 64 bites...
Csak azt nem tudom, hogy valósítják így meg a shuffle-ket. Bár arra a Core2-ben is külön egységek vannak, de itt ilyenek nincsenek...
[Szerkesztve] -
#95904256
törölt tag
dezz:Viszont, van itt az FPU-val kapcsolatban valami érdekesség a K10-ben: nem csak az eredeti FPU lett némileg nagyobb (a 128 bitesre bővítés miatt), hanem minden maghoz tartozik egy 2. FPU blokk is! (Nincs kéznél a die fotó linkje, de gondolom, megvan a kép neked is, vagy valamelyik korábbi hsz-ben megtalálható.) Nem lehet, hogy az valami ''titkos fegyver'', amit csak újrafordítás által lehet kihasználni?
Na, arról lehet szó hogy amit eredetileg linkeltél képet a ''2nd FP unit'' egység felirattal az a 128 bitre bővített SSE műveletek felső 64 bitjéért felelős egység.
[Szerkesztve] -
dezz
nagyúr
És hogy mihez képest 2x akkora (tehát a keretben, illetve a részletezett képen látható, plusz az a ''2.''): hát a Rev. F-ben lévőhöz képest. Vagy másként, a ''1st'' és a ''2nd'' összesen 2x akkora, mint a ''1st'' egyedül.
#1710: Légyszi értsd már meg, hogy az FPU (a ''1st'') már eleve ott van a magban. Nem ittad meg még a kévédat, vagy mi van?
szerk: Továbbá azt is láthatod, hogy a ''2nd''-ben nincs benne minden, mint ami a ''1st''-ben, hiányzik kb. a negyede.
[Szerkesztve] -
-
#95904256
törölt tag
-
dezz
nagyúr
válasz
#95904256
#1705
üzenetére
Neeem! Nézd meg te is figyelmesebben!
Szerk: Akár a sárga keretes magnál is ott lehetne ez a felirat, mivel ott is ott van, a kereten kívül.
#1706: Tudtommal azonos órajelen számottevően gyorsabb a Core2 x87-ben is, lásd pl. SuperPI eredmények, és más x87 alapú programok.
[Szerkesztve] -
#95904256
törölt tag
Mitől ennyivel gyorsabb a Core2 x87-ben? Annak is csak 1 FMUL/FDIV és 1 FADD egysége van.
Mennyi az az ennyi? És ki mondta hogy gyorsabb, és mihez képest?
x87-es kódban a K7/K8/Core(2) közel egyformán teljesít. Bár van egy kis eltérés itt-ott, de ezek kb. kompenzálják is egymást. Talán egy pici előnyben van a Core(2) a gyorsabb összeadás/kivonás miatt, mivel az az egyik leggyakoribb művelet. -
dezz
nagyúr
Na, erről a képről beszéltem: [link]
Vagy az van, hogy valójában közel 2x-esére duzzadt [majdnem azt írtam, duzzant - nem is rossz jó
] az FPU a szélesítés miatt, és a sárga keret eredetileg rosszul lett elhelyezve, azaz valójában nincs itt semmilyen ''2nd FP unit''?
[Szerkesztve] -
dezz
nagyúr
válasz
#95904256
#1702
üzenetére
Mitől ennyivel gyorsabb a Core2 x87-ben? Annak is csak 1 FMUL/FDIV és 1 FADD egysége van. Azok hatékonysága ennyivel jobb?
Viszont, van itt az FPU-val kapcsolatban valami érdekesség a K10-ben: nem csak az eredeti FPU lett némileg nagyobb (a 128 bitesre bővítés miatt), hanem minden maghoz tartozik egy 2. FPU blokk is! (Nincs kéznél a die fotó linkje, de gondolom, megvan a kép neked is, vagy valamelyik korábbi hsz-ben megtalálható.) Nem lehet, hogy az valami ''titkos fegyver'', amit csak újrafordítás által lehet kihasználni?
[Szerkesztve] -
#95904256
törölt tag
válasz
Zeratul
#1701
üzenetére
Pedig illene nekik, ugyanis az x87 utasítások jó része megfeleltethető egy-egy SSE skalár műveletnek is ( mindössze a cél/forrás regiszterek mások ).
Egyébként úgy tudom hogy a K8 FPU trigonometriában gyorsabb mint a K7-es.
Aztán semmi másban, vagy még rosszabbak is a késleltetései...
Új hozzászólás Aktív témák
A topikban az OFF és minden egyéb, nem a témához kapcsolódó hozzászólás gyártása TILOS!
Az ide nem illő hozzászólások topikja:[link]
MIELŐTT LINKELNÉL VAGY KÉRDEZNÉL, MINDIG OLVASS KICSIT VISSZA!!
A topik témája:
Az AMD éppen érkező, vagy jövőbeni új processzorainak kivesézése, lehetőleg minél inkább szakmai keretek között maradva.
- AMD RYZEN 5 5600X
- Intel Core i9-10850K 10-Core 3.6GHz LGA1200 (20M Cache, up to 5.20 GHz)
- BESZÁMÍTÁS! Intel Core i7 4770K 4 mag 8 szál processzor garanciával hibátlan működéssel
- BESZÁMÍTÁS! Akár részletfizetés 0% THM ÚJ AMD RYZEN AM4 processzorok 3 év garanciával 27% áfaval
- AMD Ryzen 5 3400G / BESZÁMÍTÁS OK!
- Apple iPhone 13 Pro 256GB,Újszerű,Dobozaval,12 hónap garanciával
- Eladó Realme 11 5G 8/256GB arany / 12 hónap jótállás
- Bomba áron eladó Asus Vivobook S433EA /i7-1165G7/16GB/512 GB SSD/FHD/IPS
- Playstation 4 FAT 1 TB kontroller 6 hó garancia, számlával!
- Telefon felvásárlás!! iPhone 14/iPhone 14 Plus/iPhone 14 Pro/iPhone 14 Pro Max
Állásajánlatok
Cég: Laptopműhely Bt.
Város: Budapest



![;]](http://cdn.rios.hu/dl/s/v1.gif)




Na jó, meg talán akkor is, ha túl kevés a vram, és a GPU a main ramból olvassa a textúrákat (ami inkább csak az ilyen 32-64 megás TurboMemory, és AMD-s megfelelőjével fordulhat leginkább elő
). Illetve esetleg ha jobban bejön a fizika is.



