-
Fototrend
OLVASD VÉGIG ALAPOSAN MIELŐTT ÚJ HOZZÁSZÓLÁST ÍRNÁL!!!
Új hozzászólás Aktív témák
-
Balala2007
tag
AMD SSE5: (3 operandusos fpu muveletek, fused-multiply add stb.)
http://developer.amd.com/assets/sse5_43479_BDAPMU_3-00_8-27-07.pdf -
Zeratul
addikt
válasz
robyeger
#1596
üzenetére
A Crossbar miatt nem shared hanem dedikált, azaz mikor valamelyik magnak szügsége van rá akkor tejes sávszélt megkapja, ha közben a másiknak is kellene addig az vár. Intelnél a Shared memobusz azt jelenti hogy 2 proci között megfeleződik sávszél, állandó fél sávszélt kap.
-
robyeger
addikt
válasz
#95904256
#1566
üzenetére
Hali! Igen jól érted milyen tesztekre gondolok. Az alapórajel növelésével az adatelőkészítés(adatbeáramlás) növekszik, magyarán a memóriából gyorsabban érhetők el az adatok, ergo ha nem növeljük a magórajelet a műveletetvégző teljesítménye nem fog növekedni.
Az SRQ(SRI)-t én úgy képzelem el(úgy következtetek), hogy külön buszokkal kapcsolódik az L1 cache-hez és az L2 cache-hez és egyik magórajelen másik alapórajelen működik. Az SRQ egy folyamatvezérlő, kapocs az XBAR(HTT és IMC) és a gyorsítótárak között, ezek különböző órajeleit szorozgatja igazítja egymáshoz. Azt se tudom pl., hogy programozás technikailag leválásztható-e az L2, tehát lehet-e közvetlen L1 és memória közötti kapcsolatot létesíteni az L2 kihagyásával vagy ez x86 utasítás szinten lehetetlen? Hátha te tudod, én 32biten felhagytam az assembly-vel. Nekem jóval több kérdésem van, mint válaszom, de azt látom hogy nem állnak össze a részletek, hiányosak az ismereteink
[Szerkesztve] -
Raymond
titán
válasz
robyeger
#1592
üzenetére
''...mert az osztott memóriavezérlő miatt...
Na most mar tenyleg elmesz a busba. Nem fogod ezt a topic-ot is osszeb*szani ezzel a hulyesegel. A K*8-BAN NINCS SEMMILYEN OSZTOTT MEMORIA VEZERLO. EGY VAN BENNE AMI AZ EGESZ PROCESSZORT KISZOLGALJA (MINDKET MAGOT) ES NINCS FELOSZTVA SEHOGY. UGYANAZ A VEZERLO VAN AZ EGYMAGOS ES A KETMAGOS VALTOZATOKBAN IS UGYANOLYAN FELEPITESBEN. -
robyeger
addikt
valószínűleg az van, amit te mondasz, hogy gyors egymásutánban váltogatja a magokat és ezek átlaga 50% mutat. Teljesítmény szempontjából 1szálú programnál Core2n ugyan mind1, hogy egyik pillanatban az egyik magra másik pillanatban a másik magra allokálja az alapadatokat a műveletvégzéshez, hiszen az L2 cache közös, viszont K8-nál még ilyen esetben is növekszik a teljesítmény, mert az osztott memóriavezérlő miatt az adatelőkészítés gyorsul 2magnál az 1magos procihoz képest. Csak azt tudom mondani nehéz 1magra tesztelni, 2magos procival. Talán Win98 alatt, ahogy Rive javasolta.
-
kicsivocsok
csendes tag
A Bűvös 27 ezres szám ilyen kártyákkal: ''ASUS 2900XT Crossfire 1200/1000MHz''
Na most a 30k-s tesztben: ''two HD2900XT cards were overclocked to 830MHz for the core and 900MHz for the memory''
Szóval ilyne órajelen nem hinném hogy proci limitbe ütközne... a cpu teszt pedig nem ad olyan sokat a pontszámba, hogy hirtelen 23k-ról (minimális vga tuninggal ) 30-ra ugrojon! lehetetlen! -
dezz
nagyúr
Pl. ha 15%-kal emelkednek az SM számok, és a CPU mondjuk 8000, az máris 30402 pontot ad.
-
Raymond
titán
Bocs, de nem ertem mit irsz.
A 14K+ szam ugy jon ki, hogy a legjobb elerheto grafikuskartya eredmenyeket innen:
[link] beirod a linkelt szamoloba es megnezed milyen CPU score kell ahoz hogy az osszesitett eredmeny 30K+ legyen. Es ahoz a mar emlitett 14K+ kene. Mar mennyire valoszinu, hogy egy (legyunk nagyvonaluak) 3Ghz-n jaro Barcelona majdnem ketszer akkora eredmeny-t ad mint egy 5Ghz-n jaro C2Q? Szerintem semennyire. Annak aki nem akarja a Futuremark oldalt kinyitni itt a mostani csucs eredmenyek:
3DMark Score 27039 3DMarks
SM 2.0 Score 11273 Marks
SM 3.0 Score 12088 Marks
CPU Score 7619 Marks -
Raymond
titán
válasz
#95904256
#1575
üzenetére
[link]
X6800 vs. QX6800 = 2568 vs. 4039
Az egyel feljebb linkelt progival kiszamolhatod mekkora ertek kene CPU score-nak hogy meglegyen a 30K-s eredmeny a mostani csucstarto tulhajtott 2900XT Crossfire kartyakkal:
14316
Nagyon valoszinutlen hogy majdnem 2x gyorsabb lenne egy leghutott Barcelona mint a lefagyasztott 5.1-es C2Q. Raadasul a demo rendszer kartyai alig vannak tulhajtva.
[Szerkesztve] -
#95904256
törölt tag
Hali dezz!
Szerintem közel jársz az igazsághoz. A C2Q négy magját bizony erősen visszafoghatja a szűk memóriasávszélesség. Még P.H. mutatott nekem épp egy Prohardver!-es teszteredményt ami ezt jól példázza. [link] Itt a PhotoWorxx benchmark alatt a C2Q csak 20% előnyre tett szert egy C2D-hez képest. Nem lehetséges hogy a 3DMark is beleütközik ebbe a korlátba?
Tudna valaki egy C2D és egy C2Q eredményt is megadni?
szerk.: Kicsit nézelődtem a neten, a C2Q és C2D közt 3DMark06 alatt kb. 70% különbség van azonos órajelen. Nos lehet hogy az AMD négymagosa ennél jobbat produkál egy kétmagoshoz képest...
[Szerkesztve] -
Joshi
titán
Ennél a tesztnél nagyon sok összetevő zsír új(CPU, RD790 chipset, HD 2900XT CF)!
Így együtt ki tudja mire képesek. 
Egyébként én is a kamu hírre szavaznék, vagy pedig a 3DMark06 hibás eredményére(esetleg ismeretlen hardver).
Ettől függetlenül ráférne az AMD-re egy kis siker.

-
dezz
nagyúr
Persze, de ezt miért írtad nekem?

(#1566) akosf: Úgy tűnik, csak emiatt nem érdemes másik gépet venned: tesztekből nem az jön le, amit robyeger írt...
M3kk: Elkezdtem olvasni, de most nem tudom az egészet elolvasni. Mindenesetre, hasonlóan 2 túlhajtott 2900XT-vel egy 5.1GHz-re húzott C2Q 27039 pontot hozott. Akkor ha valamit sokkal jobban csinál a 4 magos K10, miért ne tehetne rá még 3000-et? -
#95904256
törölt tag
válasz
robyeger
#1529
üzenetére
Hali robyeger!
Na, újra nekirugraszkodtam hogy megértsem a dolgot. Ha jól értettem, akkor azt kellene kimutatni hogy a processzoron belül vannak olyan részek amik magórajelen mennek és vannak amelyek nem. Példaként az SRQ-t hoztad fel.
Az állítás szerint egy döntő méréshez az alábbiakat kell garantálni:
- állandó RAM sebesség
- állandó HT sebesség
- állandó magórajel = változó alapórajel x szorzó
Ha ezek mellett változtatom az ''alapórajel x szorzó'' értéket, akkor eltérő teljesítményűek lesznek a konfigurációk.
A kérdésem az hogy minek a teljesítményében várható növekmény?
( memória / cache / integer / float-point ... teljesítmény ) -
Rive
veterán
válasz
robyeger
#1551
üzenetére
Meg irtam már, hogy X2-nél nem tiltható le az egyik mag, nem választható szét tisztán a teljesítmény a magok között, akár milyen 1szálú programmal terheled.
Ez f@szság.
Ha az OS egy magra készült, akkor a második maghoz nem tud hozzábabrálni és kész. Az bizony ott lóg meló és bármiféle hatás nélkül. Pl. '98 alatt zérónullasemmi gyorsító hatása van a két magnak. De non-SMP kerneles Linux alatt is ugyanez jön ki.
Dezz: ha egy egyszálas programot eresztesz több magot kezelni képes OS/SMP konfigra, akkor a programot elviszi az egyik mag, az OS dolgait ( IO és adminisztráció) pedig a másik. Ez ált. 3-5 százalék gyorsulás. De ha az OS nem képes több magot kezelni, akkor ezer procis gépen is pont ugyanúgy fog futni, mint egymagoson. -
Gyuri27
félisten
-
markastor
tag
Biztos volt már, de 30 000 pont 3DMark 06-al a K10-el?
Ha egy elég erős VGA-benchmark-kel ennyire porig veri az Intel-t, mi lesz itt a proci-benchmarkok-nál?
http://theinquirer.net/?article=41970 -
dezz
nagyúr
-
dezz
nagyúr
válasz
robyeger
#1554
üzenetére
Ajjaj, csak nem azt hiszed, egy echte egy-szálas programot képes mondjuk a Windows két magra ''szétosztani''?

#1553: De értsd már meg, hogy az az 1-2%, amivel a másik mag beleszól, nem számít - feltéve, hogy nem mi is ilyen 1-2%-os nagyságrendű különbséget akarunk kimutatni.
[Szerkesztve] -
robyeger
addikt
most néztem Core2 alatt a WinRAR sebesség tesztjét és hiba kapcsoltam ki a multithreading-et, csak annyi történt, hogy leset a magok terhelése 100%-ról 50% körülire, de attól még mind a két mag ugyan azon a teljesítményen dolgozott, tehát a progi a Conroe-t nem tudta rábeszélni az 1magos feladatvégrehajtásra.

Jutt eszembe csak a Vista kernele képes arra, hogy programozási szinten külön kijelölhetők a magok. Ezt pedig XP alatt csináltam.
[Szerkesztve] -
robyeger
addikt
elméletben vagy ha DOS oprendszert használsz.
A lényeg hogy befolyásolja még a szűz win alatt is. Nem pontos tesztet ad vissza. Másodsorban a transzfer teljesítmény erősen magórajel függő, tehát minél nagyobb annál nagyobb különbségeket lehet produkálni az alapórajel növelésével. pl: 2Ghz-nél 250mhz alapórajel felett már nem hoz teljesítmény növekedést, míg 3Ghz-en 333Mhz-ig is emelkedik.
Ha alaposan nézed, teszteled X2-nél is lehet érzékelni ezt nem tagadom.
[Szerkesztve] -
dezz
nagyúr
válasz
robyeger
#1551
üzenetére
''Meg irtam már, hogy X2-nél nem tiltható le az egyik mag, nem választható szét a teljesítmény a magok között, akár milyen 1szálú programmal terheled.''
Ezt most nem értem. Az egyszálas program csak az egyik magot fogja terhelni, miközben a másiknál csak ilyen 1-2%-os terheltség lesz, az OS miatt, tehát nem igazán fogja befolyásolni az eredményt.
[Szerkesztve] -
robyeger
addikt
Azért valamilyen egy magot fullra terhelő programmal jól lehet tesztelni. Hacsak nem néhány % difiről beszélünk. 200 -> 250 MHz-nek ~25% gyorsulást kellene okoznia, ha igazad van.
25% gyorsulás nem lesz természetesen
, mert ez elméleti, még a Sandra memória benchmark részénél is lefaragódik ebből. Pedig az csak transzfer teljesítményt mér, hátha még olyan programmal nézzük, ahol nem csak a transzfer, hanem a matematikai műveletvégző teljesítmény is számít, mert ugye azonos magórajelen nem fog tudni gyorsabban összeadni, csak a nagyobb alapórajel miatt hamarabb jutt adatokhoz a műveletvégzéshez. De mivel adódik teljesítmény többlet, bizonyitja azt hogy tényleg történik szorzás a procin belül, nem dísznek van az alapórajel és a szorzó.
Meg irtam már, hogy X2-nél nem tiltható le az egyik mag, nem választható szét tisztán a teljesítmény a magok között, akár milyen 1szálú programmal terheled.
[Szerkesztve] -
dezz
nagyúr
válasz
robyeger
#1545
üzenetére
''Én azonos magórajelekről beszélek, ha pedig a memória sebességét a magórajelből osztással érjük el, akkor a memória frekvenciája nem változik''
Én is így tudtam, aztán megtudtam, hogy valójában így van:![[kép] [kép]](http://upload.wikimedia.org/math/c/a/4/ca49a2eeed5cc2d6f3108d632bb72bce.png)
(Az a csak felül kapcsos zárójel a CEIL függvény, ami a kizárólag felfelé való kerekítés.)
Szal, ellenőrízted valamivel a valós ram-órajelet?
#1546: Azért valamilyen egy magot fullra terhelő programmal jól lehet tesztelni. Hacsak nem néhány % difiről beszélünk. 200 -> 250 MHz-nek ~25% gyorsulást kellene okoznia, ha igazad van.
#1547: Sok alaplapnál eleve fixáltan, azaz (kvázi-)függetlenül működnek. Nem tudom, a maradéknál minek van egyátalán máshogy, ha már úgyis ott van az a 2. (kvázi-)független órajelgenerátor...
Talán így szabványos?
Thrawn: De ugye sikerült átállítani a BIOS-ban? (Nálam igen, de úgy kellett rájönni, hogyan lehet.)
[Szerkesztve] -
-
robyeger
addikt
válasz
#95904256
#1535
üzenetére
Ha az én tesztemre gondolsz ahhoz a 2magos procik nem ideálisak, mert nem tudod letiltani az egyik magot, és nem fogod tudni szétválasztani a programok alatt mennyi terhelés éri az egyik és a másik L2 cache-t. Összeadódva pedig egyértelmű, hogy erősebbek. 2magos procit még a szűz win is kihasználhatja valamilyen mértékben, hiába futtatnál rajta pl. WinRAR-t multithreading tiltással. Én miattam ne vegyél 1magos procit, mert nem éri meg

-
robyeger
addikt
válasz
Zeratul
#1531
üzenetére
persze ha emeled az alapórajelet vele együtt nő minden, de ez mellett van 2db szorzónak a procié és a HTT és egy memória osztónk, hogy szabadabban lehessen variálni. Én azonos magórajelekről beszélek, ha pedig a memória sebességét a magórajelből osztással érjük el, akkor a memória frekvenciája nem változik és a magórajelet több féle alapórajel és szorzóból is elő lehet állítani. Már régebben is irtam, hogy a legideálisabb példa a 3200+ Venice DDR500-as memóriával, mert 200x10-n és 250x8 is lehet 1Ghz HTT és 500Mhz-es memória órajelet alkalmazni.
AM2-nél nehezebb úgy megválasztani a dolgokat, hogy Mhz-re pontosan kijöjjön a szabványos HTT vagy memória órajel ez tény, de ezért is javasoltam a legegyszerűbb tesztet, ahol 1magos AM2-nél minden alapon és csak a single vagy dual 800Mhz ram között váltogatunk és így nézve a rendszer összteljesítményét (nagyobb HTT terheléseket leszámítva, amik CPU függetlenek, mint pl: 3D grafika), itt látható, hogy nem tudja szegény kihasználni a dual 800-t.
Amúgy ez mind szabványos beállítás, csak van közte félhivatalos is, ilyen a DDR500 vagy 1magos AM2 prociknál a DDR2-800. Ha abból indulunk ki, hogy egy mag L2 cache az SRQ(SRI)-től csak 6,4GB/sec sávszélel érhető el, akkor érthető az is, hogy az AMD miért csak DDR2-667Mhz-ig igér hivatalos támogatást az 1magos AM2 procijaira. Mert egy dual DDR2-667 ram 10,67MB/sec sávszéleséggel bőven kielégítő.
K7, K8, K10 -nél folyamatosan duplázták a buszszélességeket (32bit,64bit,128bit), ebből következően az L2 cache memória felöli elméleti sávszélességeket is 3200, 6400, 12800 MB/sec-re növelték. Ezért is volt mindig olyan kis különbség az egy és két csatornás megoldások között, pl: 754 / 939 -
dezz
nagyúr
válasz
Zeratul
#1539
üzenetére
A HT freki emelkedését figyelembe vette, mert írta, hogy 200x5 vs. 250x4. Viszont a ram-freki emelkedését lehet, hogy nem vette figyelembe, azaz nem növelte a ram-osztót. De majd megmondja, így volt-e vagy sem.
ps. bizonyos alaplapoknál alaphelyzetben az AGP/PCI freki is az alapfrekihez kötött. -
Zeratul
addikt
Robigyerek az nem veszi figyelembe hogy bizonyos processzor szorzók nem minden esetben használnak szabvány frekvenciákat minden ramtipusnál. Van ahol uder van ahol overclocking van alaphelyzetben is. Másik amit nem vesz figyelembe hogy ha növeli az alapfreki megy vele minden ram, CPU HT freki is. AGP/PCI/PCIE azért nem változik mert külön órajelet kap PLL től viszont a megnövekedett HT fereki jobban terheli az északi hidat.
-
dezz
nagyúr
Ja, látom nem hivatalos a DDR500 támogatás sem, csak van (tehát hogy az alapfreki növelése nélkül elérhető).
Amúgy itt egy jó nagy tévedés van: ''Potentially as a backup plan, the Rev E chips include unofficial support for memory faster than DDR400, without overclocking the Hyper Transport bus.''
Ugyebár ennek semmi köze a HT buszhoz...
Anand, Anand... 
-
dezz
nagyúr
válasz
#95904256
#1535
üzenetére
Itt láthatod a választékot: [link]
Ki kellene okoskodni, egy ilyen teszthez melyik lenne a legideálisabb X2-ből.
Ha úgyanúgy egy 2GHz-es, egy 3800+-os kell neked, Manchester, Toledo, vagy Windsor. Az elsőt már nem ajánlom. Húzás szempontból a Windsor-ok a legjobbak (ezen belül is minnél nagyobb, annál jobb). Ha még egyátalán kapható 3800+-os, mert 90nm-esekből már csak min. 4200+-ost szállít a cég.
A 65nm-es Brisbane-ek kevésbé húzhatók, de persze kevesebbet is fogyasztanak. 2GHz-es nincs belőlük.
(AM2-n az 1066-os DDR2 ramok hivatalos támogatása lenne a s.939 + DDR500-nak megfelelő dolog, de ilyen itt nincs, majd a K10 fogja azokat hivatalosan támogatni.)
[Szerkesztve] -
#95904256
törölt tag
Várj dezz! Látom te érted hogy mit is javasolt robyeger. Bevallom én első nekifutásra nem értettem meg, de még neki futok újra. Már elindítottam egy AM2 rendszer beszerzésést, de processzort még nem választottam. Melyik X2 lenne ideális egy ilyen teszthez? Gondolok itt arra hogy említve lett a DDR500-at támogató Venice mag. Eddig csak fél füllel hallottam hogy ilyesmi is létezik...
-
Zeratul
addikt
válasz
robyeger
#1529
üzenetére
Növeled a ramfrekvenciát hogy brontba ne nőne a teljesítmény a megnövekedett sávszél miatt? AM2 magas ram látencia miatt + a szűk cache sávszél miatt nem tud profitálni igazán a megnövekedett sávszélből, nem véletlen hogy K10nél az első újítás ez volt. IMC, Crossbar SQR komplex magórajelen működik a CPU cache és egyébb belső adatcsatornák sávszélét a magórajel határozza meg. A külső interfaced csatornák mint HT link és Memória busz pedig szabvány szerint frekiknek megfelelően kerül meghajtásra és ebből ered a sávszél. Elméletileg és szabvány alapfrekit használva a magórajeltől függetlenül mindig szabvány sávszélnbek kell meglenni a HT linkeken és Memóriabuszon. Viszont a memóriabusz működése nem teljesen szabvány szerint történik bizonyos proceszor szorzók esetén eltérhet szabvány frekvenciától +/- viszonylatban. De az IMC-crossbar-SRQ complex mag felé nyújtott sávszélességét nem befolyásolja és nem érint a HT link átersztő képességét se. K10 esetén a L3 jelenléte miatt ez jelenség valószínűsíthetőleg megszűnik.
-
robyeger
addikt
válasz
#95904256
#1516
üzenetére
két legszembetünőbb példa:
-kell egy 1magos AM2 proci lehetőleg 2Ghz felett, mert 2Ghz-nél képes 1mag közel a dual 400Mhz-es ram kihasználására, akár hogy növelnék az alapórajelét. pl:
AM2 3800+ (Orleans) és dual 800Mhz-es ram, össze lehet hasonlítani a 200x12 és a(240x10 vagy 266x9 vagy 300x8) a HTT és a memória sebességét megpróbálni minél közelebb a gyári értéken tartani. / Lehet single és dual 800-as ram felállással is tesztelni és viszgálni a kettő közötti teljesítménykülönbséget.
-a legjobb példa a DDR500-as támogatású Venice magok: tehát 3200+ venice-nél 200x10 a proci és 500Mhz-en a memória 5x200 a HTT összehasonlítva 250x8 a procinak szintén 500Mhz a ramnak és 4x250 a HTT-nek. Azért ideális, mert itt minden Mhz-re pontosan azonos HTT és a ram freki is, kivéve a alapórajel és a szorzó, vagy másik a 3800+ venice 208x12, memória 500< felett, HTT 208x5 összehasonlítva 250x10 a procinak memória 500Mhz-en a HTT 4x250-n. Hiába gyorsabb a ram és a HTT valamivel, akkor is a magasabb CPU alapórajelű fog győzni teljesítményben.
Persze ez X2-re is vonatkozik csak ott 1magra kell vetíteni, tehát ha egy programod ki tudja használni mindkét magot, akkor a dual 800-as vagy DDR1-nél a 500Mhz-es ramokat is ki tudja használni.
Nem nehéz észrevenni hogy azonos magórajeleken is teljesítmény növelő hatása lehet az alapórajel növelésének, ebből pedig az következik, hogy a prociban van ami alapórajelen megy van ami magórajelen közte pedig a szorzó. Egyesek viszont azt állítják minden magórajelen megy a prociban és lényegtelen az alapórajel értéke csak a magórajel a meghatározó.
[Szerkesztve] -
dokar
addikt
-
slett27
addikt
válasz
#95904256
#1523
üzenetére
Éppen mostanában teszteltem (mindig csinálok screenshot-ot).
1. konfig : E2160 + 8800GTS 320MB + 2x1GB DDR2 800MHz 3DMark06 : 7422 pötty
2. konfig : A64 5200+ 8800GTS 320 + 2x1GB DDR2 800MHz 3DMark06 : 8680 pötty
Ugye csak a proci változott, igaz nem nagy változás pontosan 17% a végeredményben.
(E2160 1583 CPU pont, A64 X2 5200+ 2024 CPU pont itt részeredmény szinten 28%)
A cikknél 2,5GHz -> 3.0GHz 20% túlhajtás. 23000 pötty >>> 30000 pötty ez 30% !!!.
Vmit kihagytak a cikkből.
Vagy nem ''ismeri'' még a 3DMark06 a 4 magos AMD-t.
-
#95904256
törölt tag
válasz
kicsivocsok
#1515
üzenetére
Egy rendszerben legalább egy valamit 30%-kal túl kell hajtani ahhoz hogy elképzelhető legyen egy ugyanilyen mértékű növekmény. A processzor órajele csak 20%-kal nőtt, tehát valami mást gyorsítottak 30%-kal...
-
7600GT
senior tag
válasz
kicsivocsok
#1515
üzenetére
Érdekes az biztos de ne felejtsük el, hogy a 3dmark06 elég sokat profitál a CPU-ból.
De a növekedés mértéke tényleg gyanus. -
Thrawn
félisten
válasz
kicsivocsok
#1515
üzenetére
Ha ennek csak a fele igaz...

-
#95904256
törölt tag
válasz
robyeger
#1509
üzenetére
a gyakorlat ellentmond annak, hogy minden magórajelen megy, amúgy is akkor hol a szorzó és minek van dísznek?
Lehet hogy nem figyeltem, de hol van gyakorlati ellentmondás? Ki lehet mérni?
A szorzó meg azért van ott hogy egyszerűbb legyen a CPU-t körülvevő hardver. Egyrészt sokkal drágább egy mikrohullámú ( 1GHz felett ) órajelgenerátor kiépítése és árnyékolása mint egy kisebb frekvenciás órajel felszorzása egy CPU-ba integrált PLL áramkörrel. -
kicsivocsok
csendes tag
[link]
Elég érdekes cikk... 2.5 gigán 3dmarkban 23k-t hoz két szinte alig túlhajtott 2900xt-vel...
3 gigán már 30k-t ér el? Na persze
Aki játszadozott már 3dmark06os kalkulátorral, az bizony tudja, hogy nem arányos növekszik a cpu pontszámától
De nyugodtan mondjatok ellenvélemyént, szerintem ez eléggé fake :\ -
dezz
nagyúr
válasz
robyeger
#1508
üzenetére
Ismétlem: talán az oroszok úgy teszteltek, hogy nem módosították a cache-beli adatokat, így a másik mag a memóriából olvasta őket. Akosf, P.H., nem akarjátok ezt rendesen letesztelni? ;)
''szerintem az L2 cache-t kapcsolják a SRQ-hoz, a kérdés itt hogy hány db 64bites adatbusz megy és milyen órajelen?''
Neked ezekből az elnevezésekből ez következik?: CPU0/1 Data, CPU0/1 Probes, CPU0/1 Requests, CPU0/1 Int(errupt)? Ugyan... -
Zeratul
addikt
válasz
robyeger
#1509
üzenetére
az SRQ crossbar IMC komplex magórajelen ketyeg de kifele mindig az adott busz/link szabványának megfelelően kommunikál. IMC és Ram között a szabvány DDR2-800 kommunikáció folyik, A socketek egymás között a HT link szabványnak megfelelően kommunikálnak, de odabent a magon belül a mag órajelén történik kommunikáció. Interface kifejezés mond valamit?
[Szerkesztve] -
robyeger
addikt
sajnos van egy-két féligazságunk, de nem elég hogy összerakjuk a teljes igazságot
Igen vannak akik detto ugyan annak gondolják a kezdetektől, vannak akik az SRI-t az SRQ tovább fejlesztésének tekintik. Ha figyelted az előző hozzászólásokat, én azzal indítottam, hogy kétségbevontam az X-bit lab állítását miszerint a két mag csak a memóriavezérlőn keresztül tud kommunikálni egymással, de a gyakorlat az oroszokat igazolja, gondoljon mindenki amit akar, én személy szerint nem ezt látom fő problémának, hanem azt hogy az 1magos AM2 procik dual 400Mhz-es memóriánál gyorsabbat nem tudják kihasználni, vagy a Venice magoknál bevezetett DDR500-as támogatásnál tapasztaltak, ezekből pedig az következik, hogy az SRQ(SRI)-től az L2 cache csak alapórajelen érhető el. Szívesen fogadom bárki véleményét, aki el tudja magyarázni nekem, hogy hol található a processzor szorzó a K8-ban és miért van ez így a gyakorlatban(az előbb felsoroltak). 
#1503: szerintem az L2 cache-t kapcsolják a SRQ-hoz, a kérdés itt hogy hány db 64bites adatbusz megy és milyen órajelen?
[Szerkesztve] -
dezz
nagyúr
válasz
robyeger
#1505
üzenetére
Az felmerült már benned, hogy SRI = SRQ? Vagy az, hogy azokban a bizonyos tesztekben nem vették figyelembe, hogy a MOESI alapján csak a módosult adatokat olvassa az egyik mag a másik mag valamely cache-éből, a módosítatlant pedig a memóriából? Továbbá ajánlom figyelmedbe a számodra feltett kérdésem a #1503-asban.
-
robyeger
addikt
Csak találtál valamit
2001-es ábrák 2002-es szövegkörnyezetben, és ki tudja utólag módosítottak-e a szövegen. Furcsállom, hogy annak idején a laborok hogy nem figyeltek fel egy ''több magos architektúrára'', persze a kezdetekkor szerintem szó sem volt ''System Request Interface''(SRI)-ről, de ha az AMD 2004-ben azt állítja, hogy mindig is ott volt, [link] legyen, biztos csak én vagyok ilyen szkeptikus, bocs 
Azaz érzésem ezekkel a felületes prezentációkkal sokra nem fogunk jutni, hogy pontosabban megértsük, mi is az a processzor szorzó a K8-ban, miért nem képes az 1magos AM2 proci kiaknázni egy dupla csatornás DDR2-800Mhz ramokat?
MOESI: Valahogy az SG-nél se értették: ''Különösebben mélyreható részleteket egyelőre nem árult el erről az AMD, tehát egyelőre az sem tiszta például, hogy szükség esetén hogyan jut el az adat az egyik mag gyorsítótárából a másikéba.''
Szóval csak 2verzió lehetséges vagy hardveres vagy szoftveres a hiányosság. Ha abból indulunk ki, hogy az SRI-n keresztül össze vannak kötve közvetlenül a gyorsítótárak, akkor kizárásos alapon csak szoftveres bibi lehet.
Másodsorban ha pedig azt vesszük hogy alapórajelen közlekednek az adatok az SRQ és az L2 cache között, akkor nem adódik nagy sebesség különbség, hogy átnyulik-e a másik mag gyorsítótárába vagy lemegy inkább a memóriához. A gyakorlati tapasztalatok nem változnak olyanok, amilyenek
, 1x csak megtudjuk a részleteket. -
dezz
nagyúr
válasz
hunnylander
#1502
üzenetére
Ja, egyébként azért olyan gyors a Core2 pl. hangfeldolgozásban, mert 2x szélesebbek a SIMD egységei, mint a K8-nak (128 bit vs. 64 bit, azaz pl. 4db egyszeres pontosságú számítás vs. 2db ilyen számítás egy időben). Nos, a K10-nek is ugyanilyen szélesek lesznek a SIMD egységei. Ezzel magához képest kb. 2x gyorsabb lesz ebben. Namost, ha azt nézzük, hogy a Core2 csak 30%-kal gyorsabb a K8-nál, a K10 meg nyugodtan gyorsabb lehet a Core2-nél...
-
dezz
nagyúr
Bocs, hogy csak most reagálok.
''A processzorok összes HyperTransport linkje szinkron módban működik, a HyperTransport I/O Link Specification-ban leírt módon (ez feltételezi, hogy aszinkron módot is tudnak, bár nem ismerem az adott specifikációt).''
Nem feltételezi. Ne zavarjon meg a ''mode'', nem ide vonatkozik, hanem általánosságban a lehetséges működési módokra. Az ilyen megfogalmazás azt szokta jelenteni, hogy ez ezt tudja.
''Ezen leírt szinkron mód elengedhetetlen feltétele, hogy az összes link esetén mind az adó, mind a vevő vonalak azonos óraegységeken alapuljanak.''
Szerintem hasznosabb lenne itt egy szó szerinti fordítás, tehát vonalak órajelei, és azonos időalapból létrehozott.
''(Mivel a korábbiak - pl. ''Processors can be configured with link frequencies from up to two link frequency groups.'' - alapján feltételezhetően a koherens és a nemkoherens linkek eltérő frekvencián működhetnek egy CPU-n belül).''
Nem vagyok benne biztos, hogy a fenti mondattal erre utaltak, mivel az teljesen nyilvánvaló, hogy egyforma frekvencián kell működniük - ennél sokkal fontosabb itt, hogy egyforma fázisban is legyenek, amit egy közös alap-órajel tud biztosítani.
''Ha egy link két végén lévő eszközöknél két különböző órajelgenerátor állítja elő a közös frekvenciát, akkor a következő követelményeknek kell eleget tenniük:''
Nem frekvenciát, hanem órajelet! Nem mindegy. Továbbá nincs helye itt a közös szónak, csak közel áll egymáshoz a kettő.
''1. Mindkét órajelgenerátor azonos forráson alapul -> azonos frekvencia feltétel? (Ez itt a sejtésem szerint a fenti bináris értékekre utal, amelyek szabványosak, bármilyen alapból legyenek előállítva. Vagy emellett egyben az egyetlen közös alapórajelre meglétére is utal, mely mindkét eszköznek egyik adott bemeneti jele kell legyen? Utóbbi léte leegyszerűsíti a helyzetet.)''
Itt ugyanaz a helyzet, mint feljebb. Nem szabad az órajel és a frekvencia szavakat szabadon keverni. A frekvencia-beli egyezés nyilvánvalóság, itt az azonos fázis a lényeg, azaz az azonos referencia-órajel. (Tehát az utóbbi eset.)
''2. Spread spectrum (erre mi a helyes magyar kifejezés? Kiszélesített? Vagy nem szigorú határú?)''
Szórt spektrumú. A frekvencia átlaga egyforma, de kis eltéréssel folyamatosan váltakozó. (Így nem egy adott frekvencián ad le nagy energiát elektromágnesesen, hanem szétszórva kicsit.)
''órajelezés már csak akkor engedélyezhető, miután (ha egyáltalán) a két órajelgenerátor esetleges eltérő üteme már összehangolttá válik.''
Nem egészen erről van szó. A szórt spektrumú órajelezés alapfrekvenciától való eltérései szinkronizáltak, vagy hogy kevésbé legyen zavaró a megfogalmazás: egyeztetettek.
'' -> azonos fázis feltétel?''
Természetesen.
(#1495) robyeger: A #1499-esben kiderült az igazság, de azért megkérdezném: szerinted mégis mi a csuda lett volna ott az a CPU0 és CPU1? Honnan/hová vezettek volna azok a vonalak?
hunnylander: ''A K8 leszerepel a Conroe ellen, még magasabb órajelen is.''
Én ott csak azt látom, hogy azonos órajelen (3GHz) a C2D kb. 30%-kal jobb. Az meg nem csoda, hogy 2x-4x annyi ''CPU''-val (maggal) jóval gyorsabb valami.
[Szerkesztve] -
hunnylander
őstag
válasz
Zeratul
#1501
üzenetére
Az Intel buszrendszerét és architektúráját lehet gyalázni, de az én szakterületemen (DAW*, audio processing, zeneszerzés), mégis jobban muzsikál. A szó szoros és átvitt értelmében is.

Vessetek erre egy pillantást, a ''Sonar 6 Test'' a lényeges: [link] (A buffer/latency az minél kisebb, annál jobb. Annál hamarabb adja a rendszer a hangot, annál kisebb lesz a késés az input és az output között. A túl nagy latency használhatatlanná tesz egy DAW-t.)
Érdekelne, hogy akik többet tudnak a K10 architektúráról, és valamennyire konyítanak az audió programok működéséhez (van benne sok floating-point process meg integer is), hogy mit várjak a K10-től. A K8 leszerepel a Conroe ellen, még magasabb órajelen is. Szóval melyik lesz jobb a zenészeknek, K10 vagy Penryn? A Conroe jó szereplésében mennyi szerepe van a nagy L2 cache-nek.
Szeretnék már végre olyan dolgokat is olvasni ebben a topikban ami nem kínaiúl írt K10 sztárolás, hanem gyakorlati haszna is van, nekünk zenészeknek.
DAW = Digital Audio Workstation (Vagyis számítógép/PC rendszer kifejezetten audió és zenei munkákra optimalizálva. Manapság szinte minden zenei stúdió szive és központja egy számítógép. A rajta futó DAW szoftverekkel.)
Új hozzászólás Aktív témák
A topikban az OFF és minden egyéb, nem a témához kapcsolódó hozzászólás gyártása TILOS!
Az ide nem illő hozzászólások topikja:[link]
MIELŐTT LINKELNÉL VAGY KÉRDEZNÉL, MINDIG OLVASS KICSIT VISSZA!!
A topik témája:
Az AMD éppen érkező, vagy jövőbeni új processzorainak kivesézése, lehetőleg minél inkább szakmai keretek között maradva.
- Az Intel szerint mindenkit érint, illetve érinteni fog a CPU-hiány
- AMD Ryzen 9 / 7 / 5 9***(X) "Zen 5" (AM5)
- iPhone topik
- Revolut
- Mibe tegyem a megtakarításaimat?
- E-book olvasók
- Filmvilág
- A fociról könnyedén, egy baráti társaságban
- Nem indul és mi a baja a gépemnek topik
- AMD vs. INTEL vs. NVIDIA
- További aktív témák...
- AMD Ryzen R9 5900X 12Mag / 24Szál / 3,7 / 4,8 GHz / 22 Hónap Alza.hu garancia / Beszámítás OK!
- BESZÁMÍTÁS! Akár részletfizetés 0% THM ÚJ Intel LGA 1700 processzorok 3 év garanciával 27% áfaval
- AMD Ryzen 5 7600X BOX - Gari 2027.03.11 -ig - Eladó!
- Intel I7-8700 / BESZÁMÍTÁS OK!
- Intel I5-10500T / Beszámítás OK!
- Apple iPhone 13 / 256GB / Kártyafüggetlen / 12Hó Garancia / Akku: 100%
- Lenovo T14s Gen 1 Ryzen 7 pro 4750U, 16GB RAM, 512GB SSD, jó akku, számla, garancia
- GYÁRI TÖLTŐK Macbook Magsafe 1 és 2 Budapest,/MPL/Foxpost
- Xiaomi Redmi Note 14 5G 256GB, Kártyafüggetlen, 1 Év Garanciával
- Telefon felvásárlás!! Samsung Galaxy S23/Samsung Galaxy S23+/Samsung Galaxy S23 Ultra
Állásajánlatok
Cég: Laptopműhely Bt.
Város: Budapest



De mégis miért írtad oda ezt: 17'' 1920x1200 LCD 


Így együtt ki tudja mire képesek. 
![[kép] [kép]](http://www.fudzilla.com/images/stories/2007/August/gc%202007/pheno2.jpg)



Igen vannak akik detto ugyan annak gondolják a kezdetektől, vannak akik az SRI-t az SRQ tovább fejlesztésének tekintik. Ha figyelted az előző hozzászólásokat, én azzal indítottam, hogy kétségbevontam az X-bit lab állítását miszerint a két mag csak a memóriavezérlőn keresztül tud kommunikálni egymással, de a gyakorlat az oroszokat igazolja, gondoljon mindenki amit akar, én személy szerint nem ezt látom fő problémának, hanem azt hogy az 1magos AM2 procik dual 400Mhz-es memóriánál gyorsabbat nem tudják kihasználni, vagy a Venice magoknál bevezetett DDR500-as támogatásnál tapasztaltak, ezekből pedig az következik, hogy az SRQ(SRI)-től az L2 cache csak alapórajelen érhető el. Szívesen fogadom bárki véleményét, aki el tudja magyarázni nekem, hogy hol található a processzor szorzó a K8-ban és miért van ez így a gyakorlatban(az előbb felsoroltak).

