Keresés

Új hozzászólás Aktív témák

  • Jaffafa

    aktív tag

    válasz rudi #3 üzenetére

    "Aztán mind a ketten felpakoljátok a hálózatotokban lévő NAS-ra a saját csomagotokat. És akkor a NAS elkezd dedupliálni és kiszűri az egyformákat, ezzel megtakarít egy csomó helyet."

    Annyi külöbséggel, hogy itt inline-ban történik minden, tehát a deduplikálás már az adatok SSD-re való mentése elött megtörténik. Más kérdés, hogy a deduplikálás nem mindig müxik, hisz ha kódolt (Encrypted) adatot küldünk a cuccra, akkor nagy valószínüség szerint semmit sem fog tudni deduplikálni.

    "Most már ideje lefeküdni. De előtte elolvasom a NENYI-t, hogy merjek nagyokat álmodni." by Szözö

  • Jaffafa

    aktív tag

    válasz Peter13 #11 üzenetére

    SSD már nagyon régóta jelen van a hálózati adattárolókban. Az áruk jutott talán mára oda, hogy a "kisebb" cégeknek is megéri beruházni rá. Az árak nagyon cégfüggöek és nem mindegy, hogy mekkora mennyiséget rendelsz. Jelenleg az árak nagyjából 4-8ezer € / Netto (tánylegesen használható) Terrabyte körül alakulnak. Csak viszonyításul a SAS-Diskek kb 800-1500€ / TB fájnak.
    Persze a deduplikációval számolva a marketingben eleve úgy számolnak, hogy ha a valós 1 TB 8e €-ba fáj, akkor 1:4 deduppal számolva (,ami egy ESX vagy Hyper-V környezetben simán elérhetö) az mindjárt "csak" 2e € :DD

    "Most már ideje lefeküdni. De előtte elolvasom a NENYI-t, hogy merjek nagyokat álmodni." by Szözö

  • Jaffafa

    aktív tag

    válasz tecsu #18 üzenetére

    Nem érted. Tegyük fel, hogy van pl. 10.000 User és mindegyiknek van egy 20 GB-os saját hálózati tárhelye a cégben. Ez ugye nem sok. Namármost 10.000 x 20 GB az majd 200 TB adat. Ha a dedup "csak" 1:2 arány, akkor az alapból a fele. (Fentebb írtam, hogy mi mennyibe kerül, szal nem keveset spórolt a cég ezzel a funkcióval.) Erröl mindenképpen lesz egy backup, de nem mindegy, hogy 200 vagy 100 TB-ot kell backupolni.
    (Hozzá kell tenni, hogy manapság már a jobb backupszoftverek is imerik a dedupot.)

    "Most már ideje lefeküdni. De előtte elolvasom a NENYI-t, hogy merjek nagyokat álmodni." by Szözö

  • Jaffafa

    aktív tag

    válasz tecsu #20 üzenetére

    Ehm, amit én írtam az a valóság. Nálunk pl. kb 8000 céges felhasználó van és mindnek van egy 20GB-os hálózati lemeze. Nyilván nem fog kijönni az 1:2 deduplikálás, de ha csak 15-20%-ot nyerek a dolgon már megérte. S akkor a mi cégünk még nem is olyan nagy, az anyacéghez képest, ahol további 190000 ember dolgozik szerte a világban ^^.

    [ Szerkesztve ]

    "Most már ideje lefeküdni. De előtte elolvasom a NENYI-t, hogy merjek nagyokat álmodni." by Szözö

  • Jaffafa

    aktív tag

    válasz tecsu #23 üzenetére

    Na akkor a kedvedért lemegyek békába, mert még mindig hülyeségeket írsz...
    1 PB tárhelyünk van jelenleg az egyik filer-ünkben. Ha csak 10%-ot takarítok a deduppal, akkor is 100TB-ot spóroltam (alsó hangon is 100TB = 100.000€-t), plusz 100TB-al kevesebbet kell backupolnom. Ha még mindig nem vágod, akkor nem velem van a baj.

    "Most már ideje lefeküdni. De előtte elolvasom a NENYI-t, hogy merjek nagyokat álmodni." by Szözö

  • Jaffafa

    aktív tag

    válasz rudi #35 üzenetére

    Jó összefoglalás, és csak annyiban egészíteném ki, hogy nagyvállalati környezetben, ahol több száz/ezer júzert kell kiszolgálni, ott már egy ilyen "mezei" NAS sajna nem elég. Ott bizony röpködnek hardverenként a 25-100 millió FT-ok. (S, akkor ez még csak egy sima nagyobb cég és nem egy Google, Facebook, vagy Microsoft.)

    @Tecsu: Azt többek közt én is elfelejtettem leírni, hogy a deduplikásnak is több fajtája van. Nem feltétlenül fájl alapú (az leginkább az Object-Storage-okban van). A Block-Storage deduplikálása jellemzöen nem fájl alapú, hanem pl. minden 4KB-os block analizálva van és ha két vagy több egyforma van, akkor csak egy lesz lementve a többi meg erre az egy lementett blockra fog mutatni. Hidd el, rettentö sok helyet lehet így megtakarítani. Írok egy példát:
    Adott pl. egy virtualizációs környezet, ahol van néhány szerver és mondjuk 400 kliens. A szerverek különbözöek, de a kliensek adattartalma (OS, driver és egyéb) 90%-ban megegyezik. Legyen egy kliens foglalt tárhelye 100GB a (az egyszerüség kedvéért és thick-provisionnel számolva). Tehát ebben az esetben, ha nincs deduplikáció akkor 400 x 100GB tárhelyre van szükség. Deduplikációval viszont elég lesz 1 x 90GB + gépenként 10GB is!!!

    [ Szerkesztve ]

    "Most már ideje lefeküdni. De előtte elolvasom a NENYI-t, hogy merjek nagyokat álmodni." by Szözö

  • Jaffafa

    aktív tag

    válasz rudi #39 üzenetére

    Ez változó, de egyre inkább az a trend (nagyon helyesen), hogy a RAID-tömbök nem fizikális merevlemezekböl épülnek fel, hanem chunkletekböl. A chunklet alatt egy fizikális lemez egy kisebb szeletét kell érteni. Tehát nagyon sokáig az volt a trend (és egyes gyártóknál még mindig így van), hogy van több száz merevlemezem a boxban és ezeket összefüzöm RAID-tömbökbe (attól függöen, hogy éppen mire kell a dolog, R1, R5, R6, R10) és a RAID-tömbökböl pedig csinálok egy un. poolt. A poolból pedig készítem a logikai merevlemezeket a szervereknek (LUN). Szal ez volt eddig a trend, de mára már egyre több gyártó eljut oda, ahol pl. a HP 3PAR már vagy 5-6 éve eljutott. Nevezetesen, hogy a létezö összes fizikai merevlemezemet felosztom szeletekre (=chunkletekre), pl 128MB-os szeletekre és ezekböl a szeletekböl hozom létre a a majdani RAID-tömbjeimet. A technológiát wide-striping-nak is szokták nevezni. Hogy miért jó ez? Hát azért, mert ha kellöen nagy a szerver felé megosztott LUN, akkor ideális esetben az összes fizikai merevlemezem dolgozik, szemben a másik variációval, ahol maximum egyszerre 1-4 RAID-tömb dolgozott. Nagyon nem mindegy, hogy 500 vagy 30 fizikai merevlemezröl kapja az adatot a szerver.

    De a kérdésedre felelve: Igazából a Raid6 az nálunk csak nagy (NL-SAS) merevlemezeknél releváns, máshol mi raid5 vagy raid1-et használunk. Extrém esetben raid10-et. Van olyan gyártó, (pl. NetApp vagy EMC), ahol ún. spare-diskek vannak mindegyik poolban. Ezek sima fizikális merevlemezek, amik akkor ugranak be, ha kiesik egy merevelemez. Pooltól függöen akár 10 is lehet, hisz simán elöfordulhat, hogy a poolból egyszerre (vagy, ha nem is egyszerre, de amíg a rebuild tart, ami akár 24 óráig is eltarthat) több merevlemez kiesik. Így nem gond, ha csak a következö napon cserélik a kihullott lemezeket. (Ha kiesik egy merevlemez, sohasem gond, mert nagyvállalati szinten sohasem te cseréled a merevlemezeket, hanem az a cég, akivel szerzödésben vagy. Normál esetben nálunk 4 órán belül ki van cserélve a kihullott lemez, de a legrosszabb esetben is 24 órán belül.)
    S van olyan hálózati adattároló (remélem ez a storage box magyar neve), ahol még mindig csak sima raid-tömbök vannak és mindegyik raid tömbben van max. 1 spare. Tehát ha kiesik egymásután 3 merevlemez (a nagy számok törvénye alapján márpedig kiesik), akkor gebasz van.
    A HP 3PAR-hoz visszatérve viszont a chunkletek mellett, vannak ún. spare-chunkeletek is és azok ugranak be ha szükség van rájuk. A wide-striping miatt a rebuild (rebuild = az az idö, amíg a kiesett merevlemez helyére beugró lemez meg nem kapja az adatokat a többi lemeztöl) is sokkal gyorsabb, hisz ha kiesik egy disk, akkor nem csak 4-18 merevlemezröl jönnek a visszaállításhoz szükséges adatok, hanem akár több száztól is egyszerre. Régebben nem volt ritka, hogy 24 óráig is eltartott, hogy a rebuild megvolt, ez a wide-stripinggal simán 1-2 órára csökkent.
    Mi pl. ma már szinte mindenhol raid-5-öt használunk. Ez alól kivétel a NL-SAS, tehát a lassú nagy lemezek, ahol 2-6TB-nál nem engedhetjük meg, hogy hosszú rebuild alatt adatvesztés legyen. Arról nem is beszélve, hogy a NL-SAS merevlemezek tetü lassúak.
    (Bocs, ha túl hosszú voltam :P )

    [ Szerkesztve ]

    "Most már ideje lefeküdni. De előtte elolvasom a NENYI-t, hogy merjek nagyokat álmodni." by Szözö

  • Jaffafa

    aktív tag

    válasz tecsu #42 üzenetére

    Backup-ra sokféle koncepció van. A nagyobb cégek nyilván több fizikailag elkülönített helységekben,(vagy pl. ahogy nálunk van akár egymástól több (tíz vagy száz) km-re lévö adatközpontokban) tárolják mind a szervereket és az adatokat. Ezekben az adatközpontokban van hütés is, mert ha több száz szerver van egy teremben, azzal elég jól lehet füteni :)
    A backup éppúgy lehet lokális, vagy éppen több adatközpontba replikált. Csak pénz kérdése a dolog :)
    Jellemzöen a kritikus alkalmazások (pl. egy mobilszolgáltató, vagy egy banki alkalmazás) eleve úgy vannak felépítve, hogy a hardver két különbözö adatközpontban van és a hozzá tartozó storage is. Az adatokat pedig vagy a host, vagy a storage replikálja a két adatközpont közt. Már eleve ezt is nevezhetnénk egyfajta "backup"-nak, de valójában ez csak a rendelkezésre állási idöt növeli. Tehát ha le is áll egy adatközpont (tüz, természeti katasztrófa etc.), attól még az alkalmazás tovább futhat. De nyilván ez nem tekinthetö valódi backupnak, ezért erröl készül még egy biztonsági másolat, amit jellemzöen egy szoftver végez és adatokat merevlemezre, vagy szalagra menti le, akár több adatközpontban is.

    "Most már ideje lefeküdni. De előtte elolvasom a NENYI-t, hogy merjek nagyokat álmodni." by Szözö

Új hozzászólás Aktív témák