Il 10/07/20 12:21, Mauro Morichi ha scritto:
Il 10/07/2020 10:27, Alessandro Baggi ha scritto:
mile al tuo, con checksum, quota, notifiche e comunicazioni.
Come hai implementato il checksum nel tuo script? Io sto provando a
trovare una soluzione utilizzando l'md5 di rsync che si può ottenere
usando l'opzione --output-format="%C e altri format per altre info".
Questo è ottimo perche cmq l'hash lo calcola direttamente rsync e si
risparmia un po di tempo, quindi per ogni file scaricato inserisco il
rispettivo md5 in un manifest unico per il client contenente tutti i
checksum dei file scaricati precedentemente. Il problema è che usando
gli hardlink e utilizzando il prune, mi ritrovo a dover aggiornare
una lista molto lunga ogni volta che effettuo un prune e questo
richiede molto tempo. Al momento mi sono affidato a ZFS ma se non ho
capito male il controllo di zfs consiste nel controllare se la copia
live è cambiata rispetto a quella della parità senza che il file sia
stato modificato nella copia live (anche perche se il file viene
modificato nella copia live viene comunque aggiornato anche nel
parity) (se sbaglio correggetemi).
anche se piu' lentamente utilizzo il tool esterno. Ogni volta genero
un file con l'elenco di tutti gli md5 piu' altre info utili come
spazio occupato, spazio disponibile, numero di backup presenti.... un
po' di info leggibili, insomma.
Anche io ho provato con un tool esterno (sha512/256sum) ma quando sono
molti file (tipo il primo backup o un aggiornamento di qualche giga) ci
mette un po. Per esempio il primo backup scarica circa 600000 file e il
processo per calcolare il checksum di ogni file richiede un bel po di
tempo mentre invece utilizzando il checksum (md5 al momento) di rsync si
perde solo il tempo di sincronizzazione dei file.