On Mon, 2010-12-20 at 14:29 +0200, Florin Popovici wrote:
> 2010/12/20 Mircea MITU <[email protected]>
> 
> > Pe un sistem cu raid1 software (facut cu mdadm) si lvm over raid se
> > intampla urmatorul fenomen:
> >
> > 1. raid1 software cu mdadm
> > 2. peste raid1 se face lvm
> > 3. periodic se fac snapshot-uri lvm
> > 4. daca:
> >        a) in timp ce exista snapshot-uri lvm
> >        b) cel putin unul din snapshot-uri este accesat cumva
> >        c) raid-ul face una din urmatoarele operatii: rebuild,
> >        check-health
> > 5. atunci sistemul tinde sa inghete
> >
> > Remedierea se face asa:
> > 1. reboot in single mode
> > 2. oprire operatii raid (fail & remove hdd din raid, de obicei mdadm mdx
> > -f sdx && reboot)
> > 3. stergere snapshot-uri lvm
> > 4. readaugare hdd in raid
> >
> > Voi v-ati mai intalnit cu astfel de situatii? Ati gasit alte rezolvari
> > mai rapide?
> >
> >
> 
> Salut,
> 
> Doua idei de "workaround":
> 
> - micsorezi max_speed la operatiunile de resync (via
> /proc/sys/dev/raid/speed_limit_min sau max) -- poate daca pui viteza
> suficient de mica, reusesti sa spargi situatia de IO starvation (care cred
> eu ca se intampla in cazul tau)

Am incercat, nu merge (adica merge rebuild/check mai incet dar tot
ingheata la accesarea lv-ului)

> - cat timp folosesti snapshoturi, "pui pe pauza" check-ul arrayului, cu echo
> idle >/sys/block/mdX/md/sync_action. Poate reusesti chiar mai mult, nu am
> reusit sa gasesc suficienta documetnatie pentru acest sync_action :)

Aha, de asta nu stiam, e de retinut. Insa nu workaround ma
intereseaza :)


_______________________________________________
RLUG mailing list
[email protected]
http://lists.lug.ro/mailman/listinfo/rlug

Raspunde prin e-mail lui