Le Voci dell’AI – Episodio 88: TimeGPT: Una rivoluzione nella previsione di serie temporali

Ciao a tutti, sono Vincenzo Lomonaco, ricercatore e docente all’Università di Pisa.

Nella puntata di oggi vorrei parlarvi di qualcosa di molto interessante, soprattutto per chi di voi lavora con dati di serie temporali, di serie storiche.

Parliamo di TimeGPT e di questa idea che sta prendendo sempre più piede, di creare un modello di intelligenza artificiale fondazionale che possa operare non solo su immagini o testo, ma anche su questo tipo particolare di dato.

A che punto siamo? E soprattutto funziona davvero? Scopriamolo insieme in questa puntata di Le Voci dell’AI.

Una serie temporale è una sequenza di dati raccolti o misurati a intervalli di tempo regolari.

Ogni osservazione è associata a un istante temporale, permettendo di analizzare l’andamento di un fenomeno nel tempo.

Questi dati possono essere discreti, registrati quindi a intervalli fissi come vendite mensili, o continue misurazioni in tempo reale, come la temperatura.

Le serie temporali sono presenti in molti contesti. In finanza, per monitorare l’andamento dei prezzi delle azioni, per esempio, in meteorologia, per registrare temperature e livello di precipitazioni o in economia per analizzare il PIL e i tassi di disoccupazione e infine in ingegneria per valutare il funzionamento di macchinari nel tempo.

La previsione di serie temporali è cruciale per moltissime applicazioni e permette alle aziende di ottimizzare la gestione delle scorte, alle banche di valutare il rischio finanziario, ai metereologi di prevedere fenomeni atmosferici estremi e ai governi di pianificare strategie economiche, quindi predirre il futuro aiuta a prendere decisioni informate, riducendo i rischi e massimizzando le opportunità.

L’uso di modelli matematici e di apprendimento automatico di AI consentono di analizzare la struttura presente dei dati e fornire stime accurate sul futuro, migliorando la pianificazione e l’efficienza in diversi ambiti.

Le tecniche di machine learning per la predizione di serie temporali si dividono in metodi classici e approcci basati su reti neurali.

Tra i modelli classici tradizionali o più statistici troviamo Arima, Autoregressive Integrated Moving Average, ampiamente utilizzato per catturare tendenze e stagionalità dei dati; Exponential Smoothing, un altro algoritmo che è molto utile per dati con variazioni regolari nel tempo.

Mentre nel contesto del deep learning reti neurali ricorrenti come le Long short-term memory (LSTM) e GRU, Gated Recurrent Unit, sono progettate per l’appunto per gestire dipendenze tra i dati della nostra serie storica a lungo termine, superando i limiti delle reti neurali standard.

Purtroppo modelli molto avanzati come GPT-4 invece non eccellono nella predizione del futuro dell’evolversi delle serie temporali, perché sono ottimizzati per l’elaborazione del linguaggio naturale, non dei dati sequenziali numerici.

GPT-4 quindi manca di meccanismi specializzati per catturare le dipendenze temporali a lungo termine dei dati numerici. Non è addestrato con obiettivi specifici come la previsione.

Inoltre non può aggiornarsi rapidamente con nuovi dati in tempo reale, un limite piuttosto critico per problemi dinamici come le previsioni finanziarie o metereologiche, come accennavamo prima, dove l’adattabilità ai dati più recenti è essenziale.

TimeGPT è un modello di intelligenza artificiale basato su architettura Transformer, la stessa alla base di ChatGPT per esempio, progettato specificatamente per l’analisi e la previsione di serie temporali, sviluppato da una piccola start up, Nixtla. È stato addestrato su un vasto insieme di dati pubblici e comprendente oltre 100 miliardi di valori provenienti da serie temporali, da settori come la finanza, la meteorologia, l’energia e il traffico web, tra i tanti.

Questa ampia varietà di dati consente a TimeGPT di generare previsioni accurate su data set di dati non precedentemente incontrati, senza necessità di un addestramento specifico per ogni specifico caso d’uso dominio applicativo.

La sua architettura encoder decoder con meccanismi di auto attenzione permette di catturare in modo efficace le dipendenze temporali anche a lungo termine. Quindi un qualcosa che accade nel passato remoto, come determina l’evolversi di un valore nel futuro.

L’introduzione di TimeGPT rappresenta quindi un significativo avanzamento nel contesto della previsione dell’essere temporali democratizzato, se vogliamo, l’accesso a strumenti di analisi avanzata e riducendo la necessità di competenze specialistiche di machine learning per ottenere previsioni precise.

In questa immagine vediamo come TimeGPT venga addestrato e usato per fare previsioni sulle serie temporali.

A sinistra ci sono i dati di addestramento che provengono da diversi settori la finanza, l’energia, il traffico web, il commercio, il turismo, la sanità, i trasporti.

Questa varietà di dati aiuta il modello non solo a imparare degli schemi utili per fare previsioni in questi svariati ambiti, ma proprio a generalizzare alcune strutture della serie temporale che ci consentono di fare previsioni nel futuro più accurate.

Al centro vediamo rappresentato invece il modello basato su Transformers come dicevamo, che elabora le informazioni attraverso vari livelli di analisi per riconoscere le tendenze nel tempo.

Il modello ovviamente usa tecniche avanzate per capire proprio quelle che sono le relazioni nei dati e a migliorare quindi la previsione futura.

A destra invece vediamo come TimeGPT applichi quello che ha imparato su nuovi dati, generando previsioni e quindi il valore atteso nel futuro di una serie temporale senza il bisogno di essere addestrato specificatamente su quel dato.

Questo lo rende uno strumento molto potente, versatile, utile per prevedere andamenti futuri In molte aree come il mercato finanziario, la domanda di energia o il traffico su un sito web.

In questa tabella invece, vediamo delle analisi quantitative su varie serie temporali appartenenti a diversi ambiti per capire quanto bene questo modello funzioni.

In particolare la tabella riassume i risultati delle prestazioni di TimeGPT rispetto a vari modelli di riferimento nella previsione delle serie temporali valutati secondo la rMAE ossia Relative Mean Absolute Error, dove valori più bassi indicano prestazioni migliori.

TimeGPT ottiene i migliori risultati in tutte le frequenze di previsione mensile settimanale giornaliera e oraria con i valori più bassi in tutte le metriche, dimostrando una maggiore accuratezza rispetto ai modelli tradizionali.

Modelli come Theta LSTM, TFT ottengono buoni risultati ma non raggiungono le prestazioni di TimeGPT in modo consistente.

Ad esempio TFT si avvicina alle prestazioni giornaliere ma TimeGPT mantiene il primato, mentre il modello LGBM, basato su gradient boosting ottiene il secondo miglior risultato nelle previsioni orarie, ma viene superato da TimeGPT in tutte le altre categorie.

Quindi l’eccellenza di TimeGPT nel forecasting, nella previsione, dimostra il suo potenziale soprattutto per applicazioni pratiche in settori già menzionati dove recuperare dati di riferimento per l’addestramento non è poi così banale.

Bene, in questa puntata abbiamo discusso di serie temporali e di come la tecnologia dei Transformers alla base dei Generative Pre-trained Transformer, GPT, ora stiano conquistando anche questo settore e tipologia di dati, dopo immagini e testo.

Modelli come TimeGPT di Nixtla oppure la linea di modelli Chronos di Amazon stanno dimostrando capacità paragonabili o addirittura superiori ai modelli di machine learning tradizionale, suggerendoci come, nel futuro prossimo, potremmo avere modelli unici GPT che possono gestire sinergicamente ogni tipo di dato.

Ciao e alla prossima puntata di Le Voci dell’AI!

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato sulle novità tecnologiche

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome