Deduplicazione: come gestire l’invasione dei dati

Le nuove tecnologie per la deduplicazione dei dati sono oggi alla portata della aziende di tutte le dimensioni. Anche delle Pmi.

Negli ultimi anni, il volume dei dati digitali in azienda è cresciuto in maniera esponenziale (secondo Idc, nel 2008 del 3000% in tutto il mondo), sin quasi a raggiungere il limite della “non gestibilità”. Le aziende, grandi, piccole e medie, hanno preso coscienza del problema, tanto che la crescita dell’archiviazione nelle aziende va dal 50 al 100% l’anno.

E non è tutto. Molte organizzazioni, che hanno sedi e filiali remote, sono al lavoro per consolidare le risorse dati mediante sistemi (inclusa la virtualizzazione) che consentano di creare gruppi di risorse salvaenergia e salvaspazio. Misura importante, ma non risolutiva del problema. Gran parte di analisti e addetti ai lavori sono d’accordo sul fatto che i costi associati all’archiviazione e alla gestione dei dati su disco o su nastro possono essere drasticamente ridotti grazie alla deduplicazione, traduzione dell’inglese deduplication (inutile cercarla sui dizionari, non c’è).

Che cos’è? Si tratta di una tecnologia concepita per eliminare i dati ridondanti in un sistema di archiviazione e per ridurre la quantità di dati che deve essere archiviata come backup. Può essere applicata a livello di file o di blocco. La prima individua i file simili, ne archivia una sola copia, posizionando dei “puntatori” al posto delle copie.

Benché questa tecnica sia comunque più efficiente della rinuncia a qualsiasi forma di deduplicazione, è bene tenere presente che ad ogni piccola modifica apportata a un file corrisponderà una copia aggiuntiva archiviata. La deduplicazione a livello di blocco promette un’efficienza maggiore della prima. Consiste nella ricerca di informazioni ridondanti tramite l’individuazione di blocchi di dati con dimensione pari a 4 Kb e più, dei quali viene archiviata una sola copia, indipendentemente dal numero di copie esistenti. Le copie vengono sostituite da puntatori che fanno riferimento al blocco di dati originale in una modalità invisibile all’utente, che continua a usare un file come se tutti i blocchi di dati che contiene fossero originali.

I tanti progetti avviati nel mondo dimostrano che la deduplicazione riduce il volume dei dati archiviati fino al 90%. I vantaggi che la deduplicazione apporta alle organizzazioni formano un lungo elenco: archiviare un numero molto più elevato di dati per unità di storage di quanto non sia stato possibile finora; riduzione del costo complessivo dello storage (perché il volume dei dati archiviati è inferiore); aumento effettivo della larghezza di banda di rete (non è necessario trasmettere copie sulla rete se la deduplicazione avviene all’origine); un minore impatto ambientale (meno elettricità, meno metri cubi di spazio richiesto per ospitare i dati, sia nelle sedi direzionali che in quelle remote); ripristini più rapidi, a garanzia della continuità dei processi aziendali; possibilità di garantire la conformità ai requisiti di archiviazione dei dati aziendali e legali, senza che le dimensioni dello storage aumentino a dismisura; rapido ritorno sugli investimenti, visto che si acquista e si esegue la manutenzione di una quantità inferiore di supporti di storage; riduzione degli intervalli di backup.

Insomma, una sorta di panacea. Se è così, come mai la deduplicazione non viene ancora utilizzata in modo massiccio dalle organizzazioni IT?
La risposta sta soprattutto nei costi. La deduplicazione è stata per lungo tempo uno strumento esclusivo delle grandi aziende, caratterizzata com’era da costi proibitivi, curve di apprendimento impossibili, e backup basati sulla deduplicazione solo a livello di file, una funzionalità che limitava l’utilizzo dei dati deduplicati per il ripristino di una macchina danneggiata. Fino a qualche tempo fa, questa tecnologia era così costosa da poter essere implementata soltanto dalle organizzazioni più grandi. Inoltre, poteva essere applicata solo a supporto dei server, nonostante nella maggior parte delle infrastrutture IT, gran parte dei fossero contenuti nelle workstation.

La maggior parte dei prodotti di deduplicazione sono stati ideati e venduti come soluzioni software/hardware combinate. In quasi tutti i casi era difficile giustificare i costi elevati anche del solo hardware.
Con l’avvento della reduplicazione basata sul solo software, questi limiti sono superati, e la reduplicazione è alla portata non solo delle grandi enterprise, ma anche da organizzazioni più piccole che devono superare ostacoli significativi rispetto allo storage dei dati, e, si badi bene, non solo per i server, ma anche per le workstation.

 


*L’articolo è un abstract del white paper “I vantaggi offerti dalla deduplicazione alle aziende di ogni dimensione”, a cura di Acronis.

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome