Il 20/08/2018 13:11, Marco Bertorello ha scritto:
Buongiorno a tutti,
ho due macchine identiche, rispettivamente con 1 disco SSD per OS e
cache di LVM e 2 dischi da 3TB.
Ho un solo VG, formato dai 2 dischi da 3TB e da una partizione dell'SSD :
└─sda4 8:4 0 45.9G 0 part
├─VG01-LV01_cache_meta 253:0 0 8M 0 lvm
├─VG01-LV01_cache_cdata 253:3 0 40M 0 lvm
│ └─VG01-LV01 253:6 0 5.5T 0 lvm /gluster/replicated
└─VG01-LV01_cache_cmeta 253:4 0 8M 0 lvm
└─VG01-LV01 253:6 0 5.5T 0 lvm /gluster/replicated
sdb 8:16 0 2.7T 0 disk
└─sdb1 8:17 0 2.7T 0 part
└─VG01-LV01_corig 253:5 0 5.5T 0 lvm
└─VG01-LV01 253:6 0 5.5T 0 lvm /gluster/replicated
sdc 8:32 0 2.7T 0 disk
└─sdc1 8:33 0 2.7T 0 part
└─VG01-LV01_corig 253:5 0 5.5T 0 lvm
└─VG01-LV01 253:6 0 5.5T 0 lvm /gluster/replicated
Utilizzo GlusterFS per replicare (replica 3 con arbiter; l'arbiter è un
raspberry) il volume tra i due nodi.
Su una macchina, un disco (sdc) sta cominciando a dare errori SMARTe
vorrei sostituirlo.
Qual'è secondo voi la procedura migliore per evitare di perdere dati (va
benissimo ricostruire dal nodo sano di gluster)?
grazie molte,
--
Marco Bertorello
System Administrator
Buongiorno Marco,
premetto che non ho mai avuto una problematica del genere.
Da quanto hai scritto non ci sono dischi in raid. Con il raid
probabilmente avresti avuto meno problemi.
Non avendo mai usato gluster in produzione ma solo in ambiente di test
non mi ritengo un esperto. Nella tua configurazione hai un 2 + 1
(arbiter) quindi lo split-brain non avviene ed è un punto a tuo favore.
Potresti degradare (scollegare dalla rete credo basti) il nodo (brick)
di gluster dove hai il problema, sostituire il disco danneggiato (magari
se hai abbastanza spazio sposta i dati sul disco rimanente del volume
LVM) e poi ricollegare il brick a gluster in modo tale che il nodo
master risincronizzi quello appena collegato. Durante questa operazione
gluster dovrebbe comunque funzionare e garantire l'accesso ai dati.
Penso che questo servizio sia funzionante in un'azienda per cui non
stopperei tutte e due le macchine primo perche con gluster non avrebbe
senso, se ha un problema su un host disattivare tutti gli host equivale
ad avere solo un host. In secondo luogo lo eviterei per evitare, nel
momento in cui riavvii gluster e nel caso in cui il primo brick sia
desincronizzato rispetto al secondo, che si generino dei problemi nel
mantenere i brick sincronizzati magari prende il brick meno aggiornato
come master e rischi di perdere qualcosa.
Prima di fare tutto, oltre al solito backup dei dati, magari fa qualche
prova su macchine virtuali onde evitare disastri.
Magari qualche utente con più esperienza potrà fornirti maggiori
indicazioni.
Un saluto.