Quanto sono efficaci le tecniche di deduplicazione?

Grazie a queste soluzioni si possono individuare e cancellare i dati ridondanti, con vantaggi in termini di costi e di gestione.

Stiamo valutando l'uso di tecniche di deduplicazione per la nostra infrastruttura dati. Quanto sono realmente efficaci queste soluzioni?

La deduplicazione dei dati è una tecnica che consente di individuare e cancellare i dati ridondanti, archiviando solamente il contenuto unico ed evitando quindi la proliferazione di miriadi di copie dello stesso dato (partendo dalla singola copia di backup si può ricostruire su richiesta tutto il contenuto nella forma originale).

I dati ridondanti possono riferirsi a interi file oppure segmenti di dati all'interno di un singolo file.

I vantaggi di questa tecnica sono immediati:

  • costi di infrastruttura ridotti (si usa meno storage);
  • aumento della velocità di backup e ripristino (si archivia una sola copia del dato);
  • riduzione dell'ampiezza di banda necessaria (circolano meno pacchetti nella rete);
  • maggiore sicurezza complessiva.

L'efficacia delle deduplicazione dipende fortemente dal tipo di dato. La deduplicazione dà il meglio di sé su file caratterizzati da segmenti ripetitivi e ricorrenti, come i file di testo. In genere video e audio non si prestano bene a un processo di deduplicazione.

La società specializzata in data protection Druva utilizza un tecnica per deduplicare i file PST di Outlook e, in base alle sue statistiche, circa l'80% dei dati nel PST può essere deduplicato. A grandi linee si può ipotizzare un rapporto di 10 a 1 per la deduplicazione, contro un 2:1 per la compressione (ovviamente si tratta di stime molto generali, che devono per forza fare i conti con il tipo di file considerato).

LASCIA UN COMMENTO

Please enter your comment!
Please enter your name here