giovedì 10 giugno 2021

Perché investire nella verifica e nella convalida del processo di backup e dei dati di backup?

In questo articolo voglio discutere un nuovo strumento software e il suo scopo per la convalida del backup (Backup Software). Molti professionisti che non hanno sperimentato la perdita totale di dati presumono che l'archiviazione digitale sia perfetta e che i dispositivi digitali funzionino sempre perfettamente; tuttavia, la realtà è molto diversa. L'archiviazione sta diventando sempre più densa e un disco rigido contiene più informazioni che mai. Allo stesso tempo, il tasso di errore non sta scendendo drasticamente, quindi la probabilità di un guasto per dispositivo è effettivamente aumentata negli ultimi anni. Inoltre, altre minacce di perdita di dati sono diventate più comuni. Ransomware, malware e vandalismo causato da dipendenti scontenti, per esempio, sono cause esterne di perdita di dati, mentre il bit rot, i difetti del disco e della RAM colpiscono il dispositivo stesso.
Un'altra tendenza degli ultimi anni è quella di utilizzare schemi di backup incrementali per accelerare il processo di backup. Sfortunatamente, ciò di cui molti professionisti non si rendono conto è che i backup incrementali introducono una dipendenza dal backup precedente. Se un qualsiasi backup nella catena di backup diventa corrotto, per qualsiasi motivo, l'intera catena o almeno parti della catena di backup diventano illeggibili. La vera ragione per cui lo schema incrementale è diventato popolare è che nonostante i progressi nel volume di archiviazione, i produttori di dischi rigidi non potevano aumentare la velocità di trasmissione allo stesso ritmo, usando la stessa tecnologia. L'archiviazione SSD ha un tasso di throughput molto migliore, ma purtroppo anche un tasso di errore molto più alto, così come un'usura molto più rapida. Le celle all'interno delle unità SSD si consumano velocemente e vengono sostituite automaticamente da celle di ricambio all'interno dell'unità stessa. Tuttavia, il processo di rilevamento di "celle prossime al guasto" è di solito rimandato fino a quando la cella viene effettivamente letta, cosa che in genere non accade spesso con le unità di backup (Backup Software for Servers).

Verifica del backup
Lo strumento di cui sopra offre opzioni di backup per verificare i file di backup immediatamente dopo il loro completamento. Queste funzioni bypassano il sistema di caching di Windows per assicurare che il file di dati venga effettivamente riletto dal disco in cui è stato memorizzato. Unica caratteristica dello strumento di cui sopra è la sua capacità di fare lo stesso anche per l'archiviazione remota. I dati vengono scaricati di nuovo per garantire che ogni file sia stato elaborato correttamente. Esistono opzioni aggiuntive per limitare questo passaggio ai file fino a una certa dimensione.

Convalida del backup
Le caratteristiche uniche di convalida dei backup nello strumento di cui sopra permettono agli utenti di convalidare i file molto tempo dopo che sono stati elaborati. Considerate il seguente scenario: un tipico file server di una piccola impresa contiene diversi terabyte di file e cartelle, tipicamente circa 10 milioni di file o più. Tipicamente meno dell'1% di questi file vengono modificati nel tempo, specialmente dopo un mese circa dalla modifica finale. In media, questi file rimarranno a riposo per anni senza essere mai acceduti. Bit rot, difetti del disco, malware, e semplici cancellazioni o alterazioni di file causate da un dipendente scontento possono passare inosservati fino ad anni dopo, quando i dischi del file server si guastano completamente ed è necessario un ripristino completo. Come si può convalidare in modo efficiente un set di dati così grande?
Il software di cui sopra offre una soluzione unica a questo problema, in cui terabyte di dati vengono sottoposti a backup quotidiano. Il software utilizza una funzione di convalida che permette una convalida casuale di una percentuale di file di backup ad ogni ciclo di backup. Potreste, per esempio, configurare il software per convalidare solo l'1% di tutti i file di backup del vostro file server. Se il vostro file server contiene attualmente 1 milione di file, ci sarebbero 10.000 file da convalidare. Convalidando una selezione casuale dell'1% di tutti i file di backup, ci vorrebbero in media 100 cicli per convalidare ogni file. Se il backup viene eseguito 10 volte al giorno, ci vorrebbero 10 giorni per convalidare l'intero set di backup.
Mentre piccoli set di backup possono essere sottoposti a backup e convalidati per intero in poche ore, quando si ha a che fare con milioni di cartelle e decine di terabyte di memoria, non è più possibile convalidare l'intero set a ogni ciclo di backup, a causa della limitata velocità di trasmissione dei dati della connessione di rete e di quella dei dischi rigidi meccanici. Come compromesso, le funzionalità dello strumento coprono l'intero dispositivo di backup selezionando un sottoinsieme casuale ad ogni ciclo di backup.
La rilettura dei file di backup è fondamentale perché aggiorna tutte le celle e i settori del disco. Usando lo strumento di convalida del backup, i vostri dati saranno 'attualizzati' dall'unità, il che significa che l'unità è costretta a ricontrollare il settore e a fare le riparazioni interne se necessario. Se le riparazioni non sono più possibili, l'unità invia un segnale a Windows e lo strumento registra il problema e invia avvisi per informarvi del problema. Inoltre, il software utilizza checksum e/o esegue un confronto 1:1 con il file originale per convalidare il contenuto di ogni file di backup. Quindi, la convalida del backup è una "assicurazione" critica da avere: avete la prova ripetuta che tutti i file nel vostro archivio di backup sono in effetti ancora validi e leggibili.