Il 20/08/2018 13:11, Marco Bertorello ha scritto:
Buongiorno a tutti,
ho due macchine identiche, rispettivamente con 1 disco SSD per OS e 
cache di LVM e 2 dischi da 3TB.
Ho un solo VG, formato dai 2 dischi da 3TB e da una partizione dell'SSD :

└─sda4                      8:4    0 45.9G  0 part
   ├─VG01-LV01_cache_meta  253:0    0    8M  0 lvm
   ├─VG01-LV01_cache_cdata 253:3    0   40M  0 lvm
   │ └─VG01-LV01           253:6    0  5.5T  0 lvm  /gluster/replicated
   └─VG01-LV01_cache_cmeta 253:4    0    8M  0 lvm
     └─VG01-LV01           253:6    0  5.5T  0 lvm  /gluster/replicated
sdb                         8:16   0  2.7T  0 disk
└─sdb1                      8:17   0  2.7T  0 part
   └─VG01-LV01_corig       253:5    0  5.5T  0 lvm
     └─VG01-LV01           253:6    0  5.5T  0 lvm  /gluster/replicated
sdc                         8:32   0  2.7T  0 disk
└─sdc1                      8:33   0  2.7T  0 part
   └─VG01-LV01_corig       253:5    0  5.5T  0 lvm
     └─VG01-LV01           253:6    0  5.5T  0 lvm  /gluster/replicated

Utilizzo GlusterFS per replicare (replica 3 con arbiter; l'arbiter è un raspberry) il volume tra i due nodi.
Su una macchina, un disco (sdc) sta cominciando a dare errori SMARTe 
vorrei sostituirlo.
Qual'è secondo voi la procedura migliore per evitare di perdere dati (va 
benissimo ricostruire dal nodo sano di gluster)?
grazie molte,

--
Marco Bertorello
System Administrator

Buongiorno Marco,
premetto che non ho mai avuto una problematica del genere.
Da quanto hai scritto non ci sono dischi in raid. Con il raid probabilmente avresti avuto meno problemi.
Non avendo mai usato gluster in produzione ma solo in ambiente di test 
non mi ritengo un esperto. Nella tua configurazione hai un 2 + 1 
(arbiter) quindi lo split-brain non avviene ed è un punto a tuo favore. 
Potresti degradare (scollegare dalla rete credo basti) il nodo (brick) 
di gluster dove hai il problema, sostituire il disco danneggiato (magari 
se hai abbastanza spazio sposta i dati sul disco rimanente del volume 
LVM) e poi ricollegare il brick a gluster in modo tale che il nodo 
master risincronizzi quello appena collegato. Durante questa operazione 
gluster dovrebbe comunque funzionare e garantire l'accesso ai dati.
Penso che questo servizio sia funzionante in un'azienda per cui non 
stopperei tutte e due le macchine primo perche con gluster non avrebbe 
senso, se ha un problema su un host disattivare tutti gli host equivale 
ad avere solo un host. In secondo luogo lo eviterei per evitare, nel 
momento in cui riavvii gluster e nel caso in cui il primo brick sia 
desincronizzato rispetto al secondo, che si generino dei problemi nel 
mantenere i brick sincronizzati magari prende il brick meno aggiornato 
come master e rischi di perdere qualcosa.

Prima di fare tutto, oltre al solito backup dei dati, magari fa qualche prova su macchine virtuali onde evitare disastri.

Magari qualche utente con più esperienza potrà fornirti maggiori indicazioni.
Un saluto.

Rispondere a