2013/11/15 Iulian Murgulet <[email protected]>

> Quoting Andrei Pascal <[email protected]>:
>
> >> >       Si pentru orice altceva exista md5sum/sha1sum. Daca ceva se duce
> >> > la vale vei vedea folosind astfel de utilitare indiferent de mediul pe
> >> > care sint datele.
> >>
> >>    Da. Ia sa vedem ce zici tu, poate iarasi nu inteleg eu si-mi scapa
> >> ceva. Caz
> >> concret: am 12 Tb de date, cu 'jde milioane de fisiere, si scriu cam
> >> 1Tb/24h.
> >> Cam cat ar dura sa fac verificari de md5sum/sha1sum? Si sa creez
> >> altele la fisierele modificate/adaugate? Dar tot nu ma ajuta cand
> >> citesc, pt. ca nu stiu
> >> daca ce citesc e asa cum a fost scris sau nu. Si daca in loc de 12 Tb,
> >> am 120Tb?
> >>
> >
> > Deci tu aici propui ca controller-ul s? ?i citeasc? înapoi ceea ce a
> scris,
> > nu? Eu asta în?eleg.
>
> NU. Pt. orice BLOCK scris, sa am un check-sum stocat pe disk pt. acel
> block.
>
>
Țeapă. Discurile au această facilitate implementată în hardware. Orice
mediu magnetic include - intern, în controller și stocat pe același mediu -
niște chestii numite coduri detectoare și corectoare de erori. Valabil și
la benzile digitale, și la discuri. Doar că astea nu se văd din afara
mediului cu pricina (la portul SATA/SAS/FC/whatever). Iar RAID-urile cu
paritate (5,6, 50,60 etc) exact asta și fac. Ceea ce vrei tu se face mult
mai simplu, cu RAID 1. Calculul unui super checksum în timp real costă -
d-aia RAID5 și RAID6 sunt lente ca porcu'.

>
> >
> >
> >>    Alt caz, cablu sATA prost: SMART zice OK, dar aleator
> >>
> >>
> > SMART nu mai apuc? s? zic? nimic, c? ?i se umplu logurile sistem mult
> > înainte de SMART dac? ai un cablu prost.
>
> NU. Nu apare nimic in LOG-ri legat de asta.
>
>



> > Dar, scuz?-m?, parc? vorbeam de
> > sistem de produc?ie (care în general trebuie s? fie foarte fiabile), nu
> de
> > calculatoare f?cute pe genunchi "s? ias? eftin, c? ?i-a?a pl?tim
> > curentu'... ", sau gre?esc? Deci ce caut? un cablu PROST într-un sistem
> de
> > produc?ie?!
> >
>
>   Nu asta e discutia, ce cauta cablul ala acolo.
>
>
Ba din păcate e, pentru că dacă n-ai avea HW făcut pe vapor în furtună n-ai
sta să reinventezi roata și apa caldă cu 30 de sisteme de corecție de erori
unul peste altul. Conectica nu trebuie să-ți creeze probleme, doar vorbim
de un setup critic, nu?


>
> >
> >>
> >> >       Si gindeste-te cite instalari de OS sint pe RAID, daca s-ar duce
> >> > ceva la vale iti dai seama ca intr-un final masinile alea ar boota cu
> >> > spatele, nu? Ah, dar stai, tu nu gindesti, doar crezi ce ai citit "pe
> >> > internet"!
> >> >
> >>
> >>    Oare asa sa fie? Toti bat campii? Si astia cu ZFS, BTRFS,
> >> ext4(metadata checksumming), XFS(metadata checksums)? Alt caz, cablu
> >> sATA defect la un moment dat: SMART zice OK, dar aleator ZFS scrub
> >> zice ca a detectat erori, si
> >> a corectat acele erori(4 din 8 teste, 2 teste/24 ore). Schimbat cablul
> >> eSATA,
> >> erorile au disparut de atunci. Si mai sunt si alte fenomene din astea
> >> ezoterice(controler disk/RAM/samd)! Aici m-ar fi ajutat cu ceva md-ul
> >> sau sumele de control md5sum/sha1sum calculate? Cand as fi aflat?
> >>
> >>    De fapt eu asta am vrut sa zic(poate nu m-am exprimat cum trebe):
> >> - md raid nu e prost;
> >> - md raid nu e cea mai buna solutie d.p.d.v. al detectiei/corectiei
> >> erorilor(erori care pot sa apara din N directii si care nu sunt
> >> imputabile
> >> lui MD: disk,RAM,echipamente,incompetenta,etc,etc);
> >>
> >
> > E la fel de bun? ca un software RAID.
> >
> >
> >> - ZFS este superior ca si capabilitatiti legate de detectie/corectie
> erori
> >> fata de MD;
> >>
> >
> > ...doar c? ZFS e o combina?ie de volume management + filesystem, adic?
> tot
> > la RAID ajungem.
>
> Si ce daca? Prinde soareci si sobolani animalu'? Ii prinde. Ce importanta
> are ca blana e cu albastru si verde! Tu zici cam asa, nu e buna decat
> pisica
> care e de culoare neagra, dar care prinde doar soareci!
>
>
Din anumite motive (despre care nu discutăm aici) ZFS nu beneficiază de
suport (comercial) decât în implementarea de Solaris. Pe Linux mai grei. Și
revenim la mediile de producție.


> >
> >
> >> - ca e treaba lui MD sau nu, ca faca detectie de erori si sa le si
> >> corecteze(intr-un mod care sa nu presupuna eforturi deosebite, gen
> >> calcul de
> >> sume de control pe milioane de fisiere si/sau zeci de Tb de date),
> >> cred ca e un aspect pur filozofic, si in nici un caz nu e ceva
> >> pragmatic.
> >>
> >>
> > E foarte pragmatic: md / RAID-ul NU V?D FI?IERE ci doar blocuri de
> alocare
> > consituite din grupuri de sectoare pe discurile fizice. Niciodat?
> > controller-ul RAID (HW sau SW) nu o s? fac? checksum la contentul unui
> > fi?ier.
> >
>
> - nu la fisiere, la block-ri de disk
>

Vezi mai sus, asta face discul în interior și, în afară, RAID-urile 5, 6,
50, 60 etc. Cu consum de CPU. Care poate fi al sistemului sau al
controller-ului raid. Care duc la penalizări de performanță care, se pare,
nu îți sunt suficiente. :)



-- 
Ave
http://flying.prwave.ro
_______________________________________________
RLUG mailing list
[email protected]
http://lists.lug.ro/mailman/listinfo/rlug

Raspunde prin e-mail lui