Dell Compellent: il data tiering non è in via di estinzione

Lo sostiene Gianluca Colombo, Business Development Manager di Dell Compellent, che lo contrappone al metodo caching.

Data qualche mese il dibattito sulla rete riguardo quale possa essere il metodo ideale tra caching e data tiering per gestire e spostare dati in uno storage ottimale.

Secondo Gianluca Colombo, Business Development Manager per l’Italia di Dell Compellent, in un mondo ideale, dove un Cio non ha nessun limite di budget, di spazio o di consumi energetici, le aziende non avrebbero bisogno di fare tier storage, perché un array composto solo da dischi a stato solido (Ssd) fornirebbe una prestazione ottimale e non ci sarebbe quindi bisogno di dischi Fibre Channel (Fc), Sas o Sata.

Nella realtà invece, si stima che l’80% dei dati sia inattivo, con il risultato che la gran parte delle informazioni archiviate da più di 30 giorni non è più consultata.
Ergo, la maggior parte dei dati di un’azienda risiede inutilmente su supporti ad alte prestazioni, ma costosi come appunto i dischi Ssd o quelli Fc da 15.000 Rpm o Sas.

Perciò, per Colombo, la sfida che gli It manager si trovano ad affrontare è di fornire alte prestazioni per le applicazioni esigenti, senza sprecare spazio su disco.

Il manager rileva come alcuni produttori stiano promuovendo come soluzione il caching di dati su memoria flash.

Tutti gli array storage archiviano primariamente i dati nelle cache come una memoria di transito prima di scrivere i dati nelle unità disco.

Alcuni vendor usano schede di accelerazione cache I/o per estrarre il dato più attivo dalla memoria di sistema e quindi trattenere quel dato in una seconda memoria di transito di sola lettura.
Per migliorare le prestazioni di applicazioni read-intensive come le e-mail, il sistema prima controlla se le informazioni richieste sono state memorizzate nella cache in uno dei moduli installati.

Senza queste cache speciali, se i dati non sono nella memoria di sistema, l’array prova ad accedere ai dischi rigidi, creando ulteriori rallentamenti.

Ma, nota Colombo, sebbene l’approccio cache possa incrementare le prestazioni I/o mascherando le inefficienze dell’architettura, questa potrebbe essere difficile da espandere e da gestire contemporaneamente all’aumentare dei dati dell’azienda.

Contemporaneamente all’evoluzione della tecnologia sulle memorie che consente di incrementare la dimensione della cache di sola lettura, gli utenti si trovano di fronte alla scelta di scartare o sostituire i vecchi moduli per approfittare delle ultime tecnologie. Inoltre, i moduli a stato solido ad alta capacità sono tipicamente supportati solamente dai più recenti sistemi e ciò aumenta la complessità dello scenario perché non permette ai clienti con vecchi array di accedere alla più recente tecnologia, a meno che essi non eseguano un upgrade di tipo rip-and-replace.

Date alcune di queste limitazioni, per Colombo il tiering automatizzato è la soluzione migliore per gestire e spostare i dati.
Il tiered storage, difatti, sposta i dati più attivi nei dischi più veloci e costosi, mentre sposta quelli inattivi nei dischi più lenti ed economici ma con maggiore capacità.
Comunque, non tutti i sistemi di storage gestiscono il tier dei dati allo stesso modo.
Alcuni prodotti potrebbero richiedere un intervento manuale o lo spostamento dei dati a livello di volume, con il risultato che, per necessità di prestazioni elevate, tutti i dati debbano essere memorizzati su un tier singolo.
Questa inefficienza può essere molto dispendiosa sia in termini di costi sia in termini di spazio su disco. Al contrario, automatizzando lo spostamento dei dati a livello granulare all’interno di un volume, le aziende possono ottenere il giusto equilibrio tra prestazioni, scalabilità, costi e facilità di gestione.

Colombo esemplifica citando, ovviamente, il sistema Compellent Fluid Data di Dell, in cui durante tutte le attività sui dati vengono acquisite informazioni dettagliate su ogni blocco come il tempo dell’ultimo accesso, il tipo di drive usato e il livello Raid.
Il sistema classifica e sposta automaticamente i dati, a seconda di come vengono utilizzati in quel momento, sul tier storage ottimale.
I blocchi attivi dei dati sono scritti sul Tier 1, con livelli a prestazioni ottimizzate come il Raid 10.
Quelli inattivi sono automaticamente spostati su un livello basso di storage (Tier 2 o Tier 3) con maggiore capacità e alta protezione Raid 5 o 6.

Quando il tiering è eseguito automaticamente, per Colombo, si possono conseguire i benefici di mantenere su dischi ad alte prestazioni solo i dati attivi. In questo modo, i sistemisti possono eliminare le attività di classificazione e di spostamento manuale dei dati, mentre si riducono il numero dei dischi, i costi e l’utilizzo di energia. Si possono, inoltre, combinare dischi Ssd, Fc, Sas e Sata nello stesso sistema e ancora dischi Sas con diverse velocità di rotazione nello stesso cassetto.
Infine, per le applicazioni critiche è possibile massimizzare le prestazioni di scrittura e di accesso ai dati con dischi Ssd come pure aggiungere nuove unità di disco a ogni livello di storage in ogni momento.

Per Colombo è errato considerare il tiering un concetto in via d’estinzione, ma al contrario continuerà a essere valido fino a quando le divisioni It continueranno ad avere vincoli a livello di budget, spazio o consumo di energia: un efficiente tiering automatico in grado di disporre intelligentemente i dati su diverse tipologie di dischi e livelli Raid, permette alle aziende di disporre di uno storage sempre accordato alle esigenze delle applicazioni.
Come risultato, l’It può automaticamente spostare le risorse dove serve, accelerando la velocità di cambiamento per supportare il ritmo sempre crescente delle imprese.

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome