On Mon, 2010-12-20 at 14:29 +0200, Florin Popovici wrote: > 2010/12/20 Mircea MITU <[email protected]> > > > Pe un sistem cu raid1 software (facut cu mdadm) si lvm over raid se > > intampla urmatorul fenomen: > > > > 1. raid1 software cu mdadm > > 2. peste raid1 se face lvm > > 3. periodic se fac snapshot-uri lvm > > 4. daca: > > a) in timp ce exista snapshot-uri lvm > > b) cel putin unul din snapshot-uri este accesat cumva > > c) raid-ul face una din urmatoarele operatii: rebuild, > > check-health > > 5. atunci sistemul tinde sa inghete > > > > Remedierea se face asa: > > 1. reboot in single mode > > 2. oprire operatii raid (fail & remove hdd din raid, de obicei mdadm mdx > > -f sdx && reboot) > > 3. stergere snapshot-uri lvm > > 4. readaugare hdd in raid > > > > Voi v-ati mai intalnit cu astfel de situatii? Ati gasit alte rezolvari > > mai rapide? > > > > > > Salut, > > Doua idei de "workaround": > > - micsorezi max_speed la operatiunile de resync (via > /proc/sys/dev/raid/speed_limit_min sau max) -- poate daca pui viteza > suficient de mica, reusesti sa spargi situatia de IO starvation (care cred > eu ca se intampla in cazul tau)
Am incercat, nu merge (adica merge rebuild/check mai incet dar tot ingheata la accesarea lv-ului) > - cat timp folosesti snapshoturi, "pui pe pauza" check-ul arrayului, cu echo > idle >/sys/block/mdX/md/sync_action. Poate reusesti chiar mai mult, nu am > reusit sa gasesc suficienta documetnatie pentru acest sync_action :) Aha, de asta nu stiam, e de retinut. Insa nu workaround ma intereseaza :) _______________________________________________ RLUG mailing list [email protected] http://lists.lug.ro/mailman/listinfo/rlug
