Mappare i dati in breve tempo? Ancora un’utopia

Un buon impianto di Bi parte dalla corretta ricerca delle fonti alimentanti più idonee. Attività spesso lunga e laboriosa, anche se alcuni nuovi strumenti possono aiutare i tecnici

L’estrazione automatizzata dei dati (data autodiscovery o discovery acceleration) è l’ultima delle “ventate” tecnologiche che hanno investito il comparto dell’intelligenza diffusa. L’idea che la muove è di ridurre la complessità tecnologica delle soluzioni di analisi e reportistica. Non è facile, infatti, implementare una soluzione di Bi e anche quelle più semplici richiedono una mole consistente di personalizzazioni e uno sforzo di integrazione notevole. «Alcune tecnologie, però – esordisce Boris Evelson, principal analyst di Forrester Research -, sono assimilabili a commodity. È il caso di parecchi strumenti di integrazione e pulizia dei dati inclusi nativamente nei motori Etl di estrazione, trasformazione e reimmissione dei dati». Molti di questi strumenti includono già, preintegrate o frutto di partnership, funzionalità di gestione della qualità del dato, ovvero di standardizzazione, pulizia, matching e miglioramento del record, che servono a supportare al meglio i processi di integrazione. Le regole definite dagli strumenti più diffusi sono pensate per riconoscere tutti i formati dati e fornire, di conseguenza, delle probabilità in merito alle loro possibili correlazioni. «Queste funzionalità – prosegue l’analista – sono fondamentali per assicurare la confidenzialità e l’usabilità dei dati da parte di qualsiasi strumento di Bi. I tool di pulizia stessi, inoltre, utilizzano queste opzioni per assicurare che i dati non vengano inutilmente duplicati. Nonostante questo, però, hanno uno scarso impatto ai fini dell’automazione della ricerca iniziale dei record presso le diverse fonti, operazione necessaria a creare l’impianto complessivo». Esistono, in effetti, strumenti in grado di aiutare l’analista di business a capire qual è la collocazione di un dato all’interno dei disparati sistemi alimentanti dell’azienda. «Prima dell’avvento dell’Etl – ricorda -, gli sviluppatori accedevano a specifiche tabelle e grafici, su suggerimento degli operatori delle unità operative, che li indirizzavano in merito al luogo ideale in cui, con maggior probabilità, avrebbero potuto trovare dei dati specifici. Questo esercizio, detto mappazione, è un’attività preventiva rispetto all’applicazione degli strumenti di estrazione e trasformazione che, tuttavia, rimane ancora in linea generale un processo lungo e manuale. Gli analisti utilizzano generalmente degli strumenti in grado di generare query Sql per analizzare le informazioni, trasferirle a un foglio di calcolo e creare le regole da applicare ai tool Etl». Per le grandi organizzazioni, va da sé, il data mapping rappresenta un’attività particolarmente onerosa, che «a quanto ci dicono, in media, gli utenti, cuba tra il 50 e l’80% dell’impegno complessivo di un progetto di Bi», tiene a puntualizzare Evelson. Molte piattaforme Etl di fascia enterprise, in realtà, includono già alcune funzionalità che permettono di semplificare tali operazioni, attraverso l’utilizzo di strumenti di profilazione dei dati che si fondano sull’analisi del dominio degli stessi, per verificare completezza, validità, e conformità dei formati. «La maggior parte di questi prodotti, tuttavia – sostiene -, si fonda sull’analisi dei metadati e in parecchie realtà ancorate all’universo legacy è praticamente impossibile riuscire a trovarne di aggiornati. Il risultato è che questi tool di profilazione risultano scarsamente efficaci». Ecco perché l’estrazione automatica dei dati inizia ad acquistare un peso rilevante. «Questi strumenti – conclude – permettono, infatti, di scovare e integrare in modo rapido e corretto le diverse fonti alimentanti all’interno di un sistema di supporto decisionale. Le lungaggini legate a questa fase possono, infatti, mettere in serio pericolo l’esito di un progetto di Bi. Tra le società attive in questo segmento, troviamo numerose startup come Exeros, Sypherlink e Noetix».

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome