Keresés

Új hozzászólás Aktív témák

  • #06658560

    törölt tag

    válasz rudi #3 üzenetére

    "Vállalati szinten, sok-sok felhasználóval állítólag akár 5:1-hez is lehet a feltöltött és az effektíven hasznos, nem duplikált adatok aránya."

    Egyszerű eset: egy prezentációt elküldesz E-mailben n embernek. Mivel nem mindenki cégen belüli, így nem elég a linket. mindenki megnézni, megkapja, lesz egy lokál mentése, minimum ideiglenesen, ha esetleg rendesen szervez, akkor tartósan is. Majd persze visszafele is hat példányban érkezik meg az anyag.

  • AgFRjkUZT_3

    tag

    válasz rudi #3 üzenetére

    Ez érdekes. Köszi.

    Csak vártam, és vártam, és mikor nem jött semmi, tudtam, csak Tőled lehet...

  • Jaffafa

    aktív tag

    válasz rudi #3 üzenetére

    "Aztán mind a ketten felpakoljátok a hálózatotokban lévő NAS-ra a saját csomagotokat. És akkor a NAS elkezd dedupliálni és kiszűri az egyformákat, ezzel megtakarít egy csomó helyet."

    Annyi külöbséggel, hogy itt inline-ban történik minden, tehát a deduplikálás már az adatok SSD-re való mentése elött megtörténik. Más kérdés, hogy a deduplikálás nem mindig müxik, hisz ha kódolt (Encrypted) adatot küldünk a cuccra, akkor nagy valószínüség szerint semmit sem fog tudni deduplikálni.

    "Most már ideje lefeküdni. De előtte elolvasom a NENYI-t, hogy merjek nagyokat álmodni." by Szözö

  • Patice

    nagyúr

    válasz rudi #3 üzenetére

    A Fujitsu is bevezette ezek szerint a btrfs-t? :U

    Eladó: Apple iPad mini 1 (2db)

  • tecsu

    addikt

    válasz rudi #26 üzenetére

    Oké, de ha van egy adatbázis, amihez mindenki hozzáfér - értelemszerűen az egész adatbázist nem hordozza magával mindenki az utolsó laptopig -, az eleve felhőben volt, vagy egy központi szerveren, azzal csak átállnak egy másik rednszerre, helyet nem igazán spórolva.

    Gondolom ez a Fujitsu nem az óriás adattárakhoz való, ez olyan középvállalatok számára tűnik megoldásnak, vagy ebből építenek kisvárosnyi parkokat is?

    https://www.youtube.com/watch?v=F7uwRuF6pYw

  • tecsu

    addikt

    válasz rudi #35 üzenetére

    Köszönöm a részletes választ.

    https://www.youtube.com/watch?v=F7uwRuF6pYw

  • Jaffafa

    aktív tag

    válasz rudi #35 üzenetére

    Jó összefoglalás, és csak annyiban egészíteném ki, hogy nagyvállalati környezetben, ahol több száz/ezer júzert kell kiszolgálni, ott már egy ilyen "mezei" NAS sajna nem elég. Ott bizony röpködnek hardverenként a 25-100 millió FT-ok. (S, akkor ez még csak egy sima nagyobb cég és nem egy Google, Facebook, vagy Microsoft.)

    @Tecsu: Azt többek közt én is elfelejtettem leírni, hogy a deduplikásnak is több fajtája van. Nem feltétlenül fájl alapú (az leginkább az Object-Storage-okban van). A Block-Storage deduplikálása jellemzöen nem fájl alapú, hanem pl. minden 4KB-os block analizálva van és ha két vagy több egyforma van, akkor csak egy lesz lementve a többi meg erre az egy lementett blockra fog mutatni. Hidd el, rettentö sok helyet lehet így megtakarítani. Írok egy példát:
    Adott pl. egy virtualizációs környezet, ahol van néhány szerver és mondjuk 400 kliens. A szerverek különbözöek, de a kliensek adattartalma (OS, driver és egyéb) 90%-ban megegyezik. Legyen egy kliens foglalt tárhelye 100GB a (az egyszerüség kedvéért és thick-provisionnel számolva). Tehát ebben az esetben, ha nincs deduplikáció akkor 400 x 100GB tárhelyre van szükség. Deduplikációval viszont elég lesz 1 x 90GB + gépenként 10GB is!!!

    [ Szerkesztve ]

    "Most már ideje lefeküdni. De előtte elolvasom a NENYI-t, hogy merjek nagyokat álmodni." by Szözö

  • Patice

    nagyúr

    válasz rudi #39 üzenetére

    Szerintem sima poolozással...

    Eladó: Apple iPad mini 1 (2db)

  • Jaffafa

    aktív tag

    válasz rudi #39 üzenetére

    Ez változó, de egyre inkább az a trend (nagyon helyesen), hogy a RAID-tömbök nem fizikális merevlemezekböl épülnek fel, hanem chunkletekböl. A chunklet alatt egy fizikális lemez egy kisebb szeletét kell érteni. Tehát nagyon sokáig az volt a trend (és egyes gyártóknál még mindig így van), hogy van több száz merevlemezem a boxban és ezeket összefüzöm RAID-tömbökbe (attól függöen, hogy éppen mire kell a dolog, R1, R5, R6, R10) és a RAID-tömbökböl pedig csinálok egy un. poolt. A poolból pedig készítem a logikai merevlemezeket a szervereknek (LUN). Szal ez volt eddig a trend, de mára már egyre több gyártó eljut oda, ahol pl. a HP 3PAR már vagy 5-6 éve eljutott. Nevezetesen, hogy a létezö összes fizikai merevlemezemet felosztom szeletekre (=chunkletekre), pl 128MB-os szeletekre és ezekböl a szeletekböl hozom létre a a majdani RAID-tömbjeimet. A technológiát wide-striping-nak is szokták nevezni. Hogy miért jó ez? Hát azért, mert ha kellöen nagy a szerver felé megosztott LUN, akkor ideális esetben az összes fizikai merevlemezem dolgozik, szemben a másik variációval, ahol maximum egyszerre 1-4 RAID-tömb dolgozott. Nagyon nem mindegy, hogy 500 vagy 30 fizikai merevlemezröl kapja az adatot a szerver.

    De a kérdésedre felelve: Igazából a Raid6 az nálunk csak nagy (NL-SAS) merevlemezeknél releváns, máshol mi raid5 vagy raid1-et használunk. Extrém esetben raid10-et. Van olyan gyártó, (pl. NetApp vagy EMC), ahol ún. spare-diskek vannak mindegyik poolban. Ezek sima fizikális merevlemezek, amik akkor ugranak be, ha kiesik egy merevelemez. Pooltól függöen akár 10 is lehet, hisz simán elöfordulhat, hogy a poolból egyszerre (vagy, ha nem is egyszerre, de amíg a rebuild tart, ami akár 24 óráig is eltarthat) több merevlemez kiesik. Így nem gond, ha csak a következö napon cserélik a kihullott lemezeket. (Ha kiesik egy merevlemez, sohasem gond, mert nagyvállalati szinten sohasem te cseréled a merevlemezeket, hanem az a cég, akivel szerzödésben vagy. Normál esetben nálunk 4 órán belül ki van cserélve a kihullott lemez, de a legrosszabb esetben is 24 órán belül.)
    S van olyan hálózati adattároló (remélem ez a storage box magyar neve), ahol még mindig csak sima raid-tömbök vannak és mindegyik raid tömbben van max. 1 spare. Tehát ha kiesik egymásután 3 merevlemez (a nagy számok törvénye alapján márpedig kiesik), akkor gebasz van.
    A HP 3PAR-hoz visszatérve viszont a chunkletek mellett, vannak ún. spare-chunkeletek is és azok ugranak be ha szükség van rájuk. A wide-striping miatt a rebuild (rebuild = az az idö, amíg a kiesett merevlemez helyére beugró lemez meg nem kapja az adatokat a többi lemeztöl) is sokkal gyorsabb, hisz ha kiesik egy disk, akkor nem csak 4-18 merevlemezröl jönnek a visszaállításhoz szükséges adatok, hanem akár több száztól is egyszerre. Régebben nem volt ritka, hogy 24 óráig is eltartott, hogy a rebuild megvolt, ez a wide-stripinggal simán 1-2 órára csökkent.
    Mi pl. ma már szinte mindenhol raid-5-öt használunk. Ez alól kivétel a NL-SAS, tehát a lassú nagy lemezek, ahol 2-6TB-nál nem engedhetjük meg, hogy hosszú rebuild alatt adatvesztés legyen. Arról nem is beszélve, hogy a NL-SAS merevlemezek tetü lassúak.
    (Bocs, ha túl hosszú voltam :P )

    [ Szerkesztve ]

    "Most már ideje lefeküdni. De előtte elolvasom a NENYI-t, hogy merjek nagyokat álmodni." by Szözö

Új hozzászólás Aktív témák