Keresés

Új hozzászólás Aktív témák

  • P.H.

    senior tag

    válasz #95904256 #796 üzenetére

    Azt azért ne felejtsd el, hogy ütemezési egyszerűsítések is okozhatják ezt: ha pl. FMA 6 órajeles, egy FADD vagy egy FMUL pedig 4 órajeles lefutású lenne, akkor az FMA indítása után 2 órajellel nem indíthatsz egy FADD egy FMUL műveletet ugyanarra a portra, mivel az azonos órajelben nem írhat ki két végeredményt. Egyszerűbb (kevesebb tranzisztort igényel) az ütemező, ha a lehető legtöbb FMAC-utasítás azonos (5) órajel idejű (az 1 órajeles port-to-port forwarding onnantól mindegy).

    Ezt az Intel egy idő (részben 45 nm Core2, teljesen Nehalem) óta erősen figyelembe veszi: egy portra lehetőleg nem ütemez egyaránt hosszabb és rövidebb lefutású műveleteket, illetve Sandy Bridge óta a sima INT, a 64/128 bites SIMD INT és a 128 bites SIMD FP eredmények nem ütköznek azonos órajelben sem, mivel külön-külön result bus-t adtak nekik.

    [ Szerkesztve ]

    Arguing on the Internet is like running in the Special Olympics. Even if you win, you are still ... ˙˙˙ Real Eyes Realize Real Lies ˙˙˙

  • P.H.

    senior tag

    válasz korcsi #964 üzenetére

    Érdekes, hogy most közölték le, itt több hónapja elérhető az eredeti fórum kivonata (és a link a fórumra), amiben Cliff Maier leírta a gondolatait. Érdekes dolgok derülnek ki belőle...

    Arguing on the Internet is like running in the Special Olympics. Even if you win, you are still ... ˙˙˙ Real Eyes Realize Real Lies ˙˙˙

  • P.H.

    senior tag

    válasz Jack@l #1597 üzenetére

    Nem volt minden eddigi procinál az, inkább csak az inkrementális fejlesztéseknél, amik ugyanazt az alapgondolatot vitték tovább.

    De nem volt az a Pentium1 -> Pentium Pro váltáskor: akkoriban pl. a PC World főcikkben hozta, hogy a Pentium Pro (idézem) "kisiklás a Pentium-vonalon", annyival lassabb volt azonos órajeleken az akkor megszokott 16 bites programokban. Az egyenesági P2-P3 leszármazottai pedig hoztak majdnem 1 nagyságrendnyi órajelnövekedést. Aztán nagyon nagy vonalakban arra épül még még ma a Sandy Bridge is.
    És nem volt az a Pentium 3 -> Pentium 4 váltáskor sem: azonos órajelen bűn lassú volt a Willamette a P3-hoz képest, ezt a Northwood nagyjából helyretette 2x-es órajelen. Csak aztán a Prescott túl korán ugyanezt eljátszotta a Northwood-dal (azonos órajelen nem volt gyorsabb), és ennek az órajelnövelése már nem kapott esélyt a Core2 miatt.
    De a Power5 -> Power6 váltáskor se volt ez igény, bár aztán mégiscsak visszatértek alacsonyabb órajelekre a Power7-tel.

    [ Szerkesztve ]

    Arguing on the Internet is like running in the Special Olympics. Even if you win, you are still ... ˙˙˙ Real Eyes Realize Real Lies ˙˙˙

  • P.H.

    senior tag

    válasz dezz #2479 üzenetére

    Bőkezűen azért osztogat(hat)tak "tranyók százmillióit" erre, mert az L3 négy részre van osztva, nem véletlenül: "

    VIRTUALIZATION FEATURES

    With more and more environments moving from dedicated servers to virtualization, integrated virtualization features are becoming an essential part of any processor design. AMD continues the tradition of the AMDVirtualization™ (AMD-V™) technology, an integrated set of virtualization features that help to boost performance and efficiency. Bit-level enhancements like Flush by ASID, Larger ASID space, and VMCB clean bits, along with a host of other hypervisor-level enhancements have been made to beef up the AMD-V support. In addition, Virtual Cache partitioning will be available, which allows a portion of the L3 cache to be dedicated to a single module (thus creating a self-contained “system in a system” for better manageability)."

    (Az ASID pedig az Address Space ID, ami a TLB-kben tesz különbséget a valós OS és a virtuális gép(ek) memóriaterületei között.)

    [ Szerkesztve ]

    Arguing on the Internet is like running in the Special Olympics. Even if you win, you are still ... ˙˙˙ Real Eyes Realize Real Lies ˙˙˙

  • P.H.

    senior tag

    válasz lee56 #2485 üzenetére

    Erre nem kell cikk SZVSZ. A Bulldozer kimondottan szerver-környezetbe készült, azt hozták le asztalra. Ennek következményeit (mint a GF100-nál is) mindenki, aki megvette/megveszi, beláthatja, legyen az pozitív vagy negatív :).

    Arguing on the Internet is like running in the Special Olympics. Even if you win, you are still ... ˙˙˙ Real Eyes Realize Real Lies ˙˙˙

  • P.H.

    senior tag

    válasz dezz #2502 üzenetére

    Ha azt akartam volna mondani, akkor az lenne ott. :)

    Máshol is történt fejlesztés (4-way decode, branch prediction, a TLB-k pedig a legsebességkritkusabb részek egyikei), így a Denebbel sem összehasonlítható direkten; az uncore részt pedig nem igazán veszed komolyan, erre írtam, amit írtam.

    Bár úgy látom, máshol ugyanúgy nem hiszik el az 1.2 milliárdot sem, mint a ~2-t.

    Arguing on the Internet is like running in the Special Olympics. Even if you win, you are still ... ˙˙˙ Real Eyes Realize Real Lies ˙˙˙

Új hozzászólás Aktív témák