Sql Server 2000 in prima fila per l’analisi dei dati Auditel in Rai

Con la tecnologia di Microsoft, Rai Information and Communication Technology ha sviluppato una soluzione di data warehouse in grado di supportare l’area marketing nell’interpretazione dei report sull’ascolto radiotelevisivo e nella programmazione del palinsesto

La Rai riceve quotidianamente i dati di ascolto Auditel, società
responsabile della rilevazione dell’audience delle principali reti televisive
nazionali. Gli elementi raccolti, che interessano l’ascolto medio relativo ai
singoli programmi televisivi (dati del trasmesso) e all’esatto momento della
giornata (ascolto esteso considerato minuto per minuto), riferiti a differenti
target di telespettatori, sono alla base della programmazione televisiva e dell’analisi sul gradimento degli utenti. Alla corretta compilazione del palinsesto e
alla successiva pianificazione degli spazi pubblicitari, come hanno spiegato i
responsabili del progetto Analisi Ascolto in Rai, partecipano diverse realtà
operative, tra cui le divisioni televisive e dell’area marketing.
Le note vengono inviate da Auditel al sistema informativo della Tv
di Stato, archiviate e messe a disposizione per studi ed elaborazioni successive. Per
aggiornare l’infrastruttura informatica e permettere al marketing
di sviluppare nuovi servizi, Rai Information and Communication Technology
(Ict) ha deciso di realizzare il sistema di analisi dell’ascolto
utilizzando la tecnologia Microsoft basata su Sql Server 2000 e Windows 2000
Datacenter.

La piattaforma multidimensionale
Per
la definizione della nuova architettura la società di viale
Mazzini ha puntato su una soluzione che consentisse analisi Olap sofisticate,
tenendo conto dell’ampia tipologia di indicatori e di dimensioni di
studio (tempo, reti, target, generi televisivi e così via), delle analisi di
data mining e della possibilità di reperire e integrare informazioni diverse
anche di tipo testuale e multimediale.
Studi e sperimentazioni hanno individuato
in Sql Server 2000 il sistema adatto per il data
warehousing, anche per la facilità d’uso e d’amministrazione e per i limitati
costi di implementazione e gestione. Il progetto, che ha visto la
partecipazione di Microsoft Consulting Services e si è rivelato particolarmente significativo da un
punto di vista tecnico a causa dell’elevato volume dei dati in gioco, ha richiesto un attento disegno del data warehouse. Le informazioni contenute
nel Dw relazionale sono caricate e sommarizzate in datamart multidimensionali
per rendere più efficiente l interrogazione e l’analisi dei dati, garantendo nel contempo prestazioni adeguate. La
“fact table” dell’ascolto esteso, per la memorizzazione dei dati di
ascolto rilevati minuto per minuto su un totale di dodici reti televisive,
supera, ad esempio, i due miliardi di record, mentre la dimensione del data
warehouse va ben oltre i 500 Gb.
L’utilizzo di tecniche di data partitioning e un attento
disegno delle componenti tecniche della soluzione hanno permesso di affrontare e
risolvere tali problematiche.

Aggiornamento e analisi di data
mining


I report che rilevano l’ascolto tengono conto di alcuni
elementi da considerare nella definizione e nella generazione di una banca dati
completa, tra cui lo zapping effettuato fra i programmi (anche solo di pochi
minuti), la collocazione di intermezzi pubblicitari e i fenomeni legati alla
reazione degli spettatori. Il caricamento dei dati, che avviene con cadenza
giornaliera, è stato realizzato attraverso i servizi Dts (Data trasformation
service) di Sql Server 2000 che hanno permesso di migliorare la velocità di
aggiornamento, rispondendo alle esigenze della Rai di analizzare i dati di
ascolto a pochi minuti dalla ricezione, cosa che avviene intorno alle ore dieci
del mattino.
Anche i requisiti funzionali e di prestazione per l’interrogazione
e l’analisi grafica dei dati (rappresentazione del palinsesto e
charting) sono risultati particolarmente sofisticati e sono stati ottenuti
utilizzando Excel 2000 e i componenti Pivot Table e Chart per le analisi
multidimensionali. Inoltre, le informazioni grezze di ascolto del campione
Auditel sono oggetto di un attento studio di datamining (attraverso gli
algoritmi integrati in Sql Server 2000) per rilevare i comportamenti degli
utenti televisivi.

L’architettura per il data
warehousing

La
direzione di Rai Ict ha definito un’architettura per il data warehousing
composta da quattro server Compaq Proliant 8500, equipaggiati con otto
Cpu Intel Pentium III Xeon 700 MHz e 4 Gb di Ram. L’utilizzo di Microsoft
Windows 2000 Datacenter definisce una soluzione di clustering a quattro
nodi ad alta affidabilità, due dei quali dedicati al data warehouse per l’area Analisi Ascolto, al fine di suddividere il carico elaborativo del
database relazionale e dei datamart multidimensionali.
Grazie alle funzionalità
offerte da Sql Server 2000, tra cui Analysis Services, la Rai può eseguire
analisi multidimensionali, sfruttando i servizi Olap, e ricerche sofisticate di
data mining su insiemi di dati complessi e di grandi dimensioni. Le tecnologie
impiegate consentono, inoltre, di integrare rapidamente le analisi eseguite all’interno dei documenti, dei report e delle tabelle in formato Word ed Excel, a
supporto delle riunioni di marketing e delle attività di pianificazione dei
programmi e degli spazi pubblicitari. Sql Server 2000, infine, permette di
effettuare query per richiedere l’elaborazione dei dati di ascolto degli ultimi
quattro anni e dell’audience delle trasmissioni andate in onda negli ultimi
dieci anni. La riduzione dei tempi di risposta del database consente, poi, un
elaborazione migliore, in grado di supportare le decisioni strategiche, la
programmazione e la vendita degli spazi pubblicitari.

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome