Home Aziende Dynatrace Dynatrace: con l’AI i log non bastano più

Dynatrace: con l’AI i log non bastano più

24 Giugno 2026

“La sfida non è la mancanza di informazioni nelle organizzazioni, bensì la carenza di segnali di qualità”. L’osservazione di Mala Pillutla, Vice President of Log Management di Dynatrace, sintetizza una delle conseguenze meno evidenti della diffusione dell’intelligenza artificiale nei sistemi aziendali. La crescita dei workload AI sta infatti aumentando la quantità di telemetria disponibile senza migliorare automaticamente la capacità delle organizzazioni di trasformarla in informazioni operative utilizzabili.

Secondo il report The State of Log Management 2026 di Dynatrace, realizzato attraverso un’indagine globale su 450 responsabili IT e decision maker di aziende con fatturato superiore a 750 milioni di dollari, nell’ultimo anno i volumi di log e telemetria sono aumentati mediamente del 93%. Le organizzazioni utilizzano in media sette strumenti differenti per raccogliere e analizzare i dati osservativi e l’80% ritiene che il tempo necessario per trasformare la telemetria in insight utilizzabili stia rallentando le iniziative di intelligenza artificiale e incidendo sull’esperienza degli utenti. Quasi tre quarti degli intervistati considerano inoltre necessario adottare piattaforme di osservabilità unificate per supportare workload AI sempre più estesi e distribuiti.

Per anni l’osservabilità ha avuto una funzione relativamente chiara: raccogliere dati sufficienti per identificare guasti, degradazioni delle prestazioni e anomalie applicative. Log, metriche e trace costituivano il fondamento delle attività di monitoraggio delle infrastrutture digitali. L’adozione su larga scala dell’intelligenza artificiale sta modificando radicalmente questo equilibrio.

I workload AI non producono soltanto più dati. Trasformano la telemetria in una componente essenziale del funzionamento dei sistemi digitali. I log non documentano più soltanto ciò che è accaduto. Diventano uno strumento per comprendere il comportamento dei modelli, verificare la correttezza delle decisioni prese dagli agenti AI, monitorare la qualità degli output e garantire che sistemi sempre più autonomi operino entro requisiti di affidabilità, sicurezza e conformità.

L’aumento dei dati rappresenta soltanto l’effetto più immediato di una trasformazione che coinvolge l’intera architettura dell’osservabilità: strumenti progettati per raccogliere eventi e diagnosticare problemi devono ora spiegare decisioni, ricostruire catene causali e fornire il contesto necessario per governare sistemi che operano in modo sempre meno deterministico.

I casi d’uso più diffusi dei log mostrano come il monitoraggio delle applicazioni tradizionali resti predominante, mentre cresce il loro impiego per comprendere comportamento, prestazioni e risultati dei sistemi AI.

L’esplosione della telemetria sta superando la capacità di analizzarla

La quantità di informazioni generata dai workload AI cresce più rapidamente della capacità delle organizzazioni di trasformarla in conoscenza operativa. La frammentazione degli strumenti continua a rappresentare uno degli ostacoli principali alla gestione della telemetria AI.

Il 71% delle organizzazioni incontra difficoltà nella raccolta e correlazione delle metriche che descrivono lo stato di salute dei sistemi AI, mentre l’82% identifica nella frammentazione della telemetria uno dei principali ostacoli alla gestione dei workload di intelligenza artificiale.

I team dedicano mediamente il 58% del tempo di analisi alla correlazione di log, metriche e trace prima ancora di poter investigare un problema o individuarne la causa radice. L’80% delle organizzazioni ritiene inoltre che il tempo necessario per trasformare la telemetria in insight utilizzabili rallenti le iniziative AI e produca effetti diretti sull’esperienza degli utenti.

Modelli generativi, agenti autonomi, sistemi di retrieval, database vettoriali, servizi cloud e applicazioni distribuite generano contemporaneamente trace distribuite, metriche operative, dati sui modelli, eventi di sicurezza, informazioni sugli utenti e indicatori di business. Comprendere il comportamento dei sistemi AI richiede la capacità di collegare tutti questi segnali all’interno di una rappresentazione coerente del contesto operativo.

Gli agenti AI cambiano il ruolo della telemetria

Un’applicazione tradizionale esegue processi relativamente prevedibili. Un agente AI interpreta richieste, genera piani di esecuzione, consulta basi di conoscenza, richiama strumenti esterni, coordina workflow e prende decisioni in modo dinamico. Ogni passaggio produce nuova telemetria e aggiunge ulteriori dipendenze che devono essere comprese e monitorate.

Log, trace, metriche ed eventi non descrivono più soltanto lo stato di salute di applicazioni e infrastrutture. Consentono di ricostruire il percorso seguito da un agente, verificare quali informazioni siano state utilizzate, identificare deviazioni dal comportamento previsto e comprendere gli effetti generati dalle decisioni adottate.

L’83% delle organizzazioni considera indispensabile una gestione della telemetria capace di seguire le azioni dell’intelligenza artificiale lungo l’intero processo decisionale. La visibilità sul singolo evento perde valore quando una risposta dipende da una sequenza di interazioni che coinvolge modelli, strumenti esterni, fonti informative e servizi distribuiti.

La telemetria diventa il livello informativo necessario per costruire affidabilità, controllo operativo e governance dei sistemi AI.

Dai log alle trace: cambia il centro di gravità dell’osservabilità

Per molti anni il log ha rappresentato la fonte principale di informazione per comprendere il comportamento di applicazioni e infrastrutture. L’intelligenza artificiale sta modificando questa gerarchia.

Una singola richiesta può attraversare modelli linguistici, sistemi di retrieval, database vettoriali, API esterne, servizi cloud e componenti applicativi distribuiti, generando catene di interazione che i soli log non riescono a descrivere in modo completo.

Il 70% delle organizzazioni considera oggi le trace distribuite il segnale più importante per comprendere comportamento e prestazioni dei sistemi AI, davanti ai log e alle metriche tradizionali.

Per valutare prestazioni e comportamento dei sistemi AI, le organizzazioni attribuiscono maggiore importanza alle trace distribuite rispetto ai log tradizionali.

I log registrano eventi. Le trace descrivono relazioni. Consentono di seguire il percorso completo di una richiesta attraverso tutti i componenti coinvolti, ricostruendo come dati, servizi, modelli e applicazioni interagiscano tra loro. In ambienti distribuiti permettono di individuare dipendenze, identificare colli di bottiglia e comprendere come una decisione o un errore si propaghino attraverso l’intera architettura.

Una risposta errata, un’azione inattesa o un comportamento incoerente raramente dipendono da un singolo evento. Possono derivare dall’interazione tra fonti informative differenti, dall’utilizzo di strumenti esterni, da dati incompleti o da decisioni prese in passaggi precedenti del workflow. Comprendere il comportamento dell’intelligenza artificiale richiede una visione capace di collegare tutti questi elementi all’interno di un unico contesto operativo.

Il 73% delle organizzazioni ritiene che i log mostrino soltanto una parte di ciò che accade nei workload AI. Comprendere il comportamento dei modelli richiede la correlazione tra log, trace, metriche, eventi di sicurezza, dati sugli utenti e indicatori di business.

Sapere che cosa è accaduto non basta più. Occorre comprendere perché è accaduto, quali componenti siano state coinvolte, quali informazioni abbiano influenzato il processo decisionale e quali effetti si siano propagati nell’intero ecosistema digitale.

Explainability e fiducia diventano requisiti operativi

I sistemi agentici operano in modo probabilistico, utilizzano fonti informative eterogenee e modificano il proprio comportamento in funzione del contesto. Affidabilità e fiducia dipendono quindi dalla capacità di ricostruire il percorso che ha portato a una determinata azione o a uno specifico risultato.

L’84% delle organizzazioni collega direttamente la fiducia nei sistemi AI alla capacità di utilizzare la telemetria per individuare e prevenire problemi prima che producano effetti sugli utenti o sui processi aziendali.

L’83% considera l’explainability una funzionalità essenziale per la gestione dei workload AI, mentre il 76% ritiene indispensabile analizzare gli eventi all’interno di un contesto operativo completo, capace di collegare ciò che accade prima e dopo ogni decisione.

Questa esigenza diventa particolarmente evidente quando l’intelligenza artificiale passa dalla sperimentazione ai processi critici. Un modello che partecipa ad attività finanziarie, operative o di relazione con i clienti deve poter essere osservato, verificato e spiegato con un livello di dettaglio molto superiore rispetto a quello richiesto durante una fase pilota.

Mala Pillutla, Vice President of Log Management di Dynatrace

Come osserva Mala Pillutla, “i team responsabili di questi sistemi automatizzati devono essere in grado di spiegare cosa è successo e perché vengono prese determinate decisioni”. La capacità di ricostruire il percorso che porta a una determinata azione diventa quindi una condizione necessaria per costruire fiducia nei sistemi AI e per estenderne l’utilizzo nei processi aziendali più critici.

L’osservabilità non serve più soltanto a monitorare infrastrutture e applicazioni. Fornisce gli elementi necessari per verificare l’affidabilità delle decisioni, individuare deviazioni dal comportamento previsto e costruire la fiducia necessaria per estendere l’utilizzo dell’intelligenza artificiale all’interno dell’organizzazione.

L’AI sta rompendo il modello economico del logging

Le organizzazioni coinvolte nello studio spendono mediamente 2,47 milioni di dollari all’anno per acquisizione, gestione, archiviazione, indicizzazione, reidratazione e interrogazione dei log. In molti casi queste attività assorbono circa la metà degli investimenti destinati all’osservabilità.

Ogni nuova applicazione, microservizio, modello, agente o componente distribuito genera ulteriori flussi di telemetria che devono essere raccolti, trasferiti, conservati e analizzati. L’infrastruttura necessaria per gestire questi dati cresce più rapidamente del valore che molte organizzazioni riescono a estrarne.

Mediamente viene escluso l’86% dei log generati dai sistemi. Le aziende limitano la raccolta, riducono i tempi di conservazione, applicano tecniche di campionamento o eliminano intere categorie di dati per contenere costi e complessità operative.

Per contenere i costi del log management, molte organizzazioni limitano la conservazione dei dati, scartano parte dei log raccolti o riducono le interrogazioni e le attività di analisi.

Le organizzazioni investono quantità crescenti di risorse per raccogliere informazioni e contemporaneamente rinunciano alla maggior parte delle informazioni disponibili perché gli strumenti esistenti non riescono a gestirle in modo sostenibile.

Il 67% degli intervistati ritiene che il costo dell’attuale approccio alla gestione dei log superi il valore ottenuto. L’80% considera le architetture tradizionali inadatte a sostenere workload AI su larga scala.

Processi come l’indicizzazione dei log per renderli rapidamente interrogabili, la reidratazione delle informazioni archiviate in livelli di storage meno costosi e la ricerca nei dati storici aggiungono ulteriori livelli di complessità. Il 74% delle organizzazioni identifica proprio questi meccanismi tra i principali ostacoli all’estrazione di valore dalla telemetria disponibile.

La logica che per anni ha guidato il mercato del log management – raccogliere il maggior numero possibile di dati e conservarli per analisi successive – mostra limiti sempre più evidenti negli ambienti AI. Nei workload AI conta meno accumulare informazioni e conta di più individuare rapidamente quelle realmente utili alle attività operative.

Il costo nascosto della frammentazione

La spesa infrastrutturale rappresenta soltanto una parte del problema. La frammentazione degli strumenti genera costi indiretti che incidono sulla velocità con cui le organizzazioni riescono a sviluppare, distribuire e gestire iniziative basate sull’intelligenza artificiale.

La gestione tradizionale della telemetria genera correlazioni manuali, strumenti multipli e dataset isolati, rendendo più difficile comprendere il comportamento dei sistemi AI.

Ogni piattaforma aggiuntiva introduce nuove integrazioni, nuovi flussi di dati, nuove competenze da acquisire e nuovi processi operativi da mantenere. La proliferazione degli strumenti produce inevitabilmente duplicazioni funzionali, sovrapposizioni tecnologiche e attività amministrative che assorbono risorse senza contribuire direttamente alla creazione di valore.

Circa un terzo delle organizzazioni paga funzionalità di osservabilità duplicate o sottoutilizzate. Più di un quarto delle risorse ingegneristiche viene impiegato per mantenere e integrare strumenti differenti distribuiti tra cloud pubblici, data center, ambienti ibridi e piattaforme AI.

L’80% delle organizzazioni afferma che il lavoro necessario per convertire la telemetria in insight utilizzabili rallenta l’evoluzione delle iniziative AI. I dati disponibili sarebbero spesso sufficienti per individuare problemi, comprendere comportamenti e ottimizzare processi, ma la frammentazione degli strumenti rende difficile trasformare rapidamente queste informazioni in decisioni operative.

Una quota rilevante del valore potenziale dell’intelligenza artificiale rimane così bloccata tra fase pilota e produzione. Non per limiti dei modelli o della capacità di calcolo, ma per la difficoltà di costruire un livello di osservabilità capace di fornire informazioni affidabili, contestualizzate e immediatamente utilizzabili.

La fine degli strumenti standalone

Per anni le organizzazioni hanno costruito stack composti da strumenti specializzati per logging, Application Performance Monitoring, distributed tracing, gestione degli eventi, monitoraggio delle infrastrutture e analisi della sicurezza. Ogni categoria rispondeva a esigenze specifiche e produceva una propria rappresentazione del sistema.

La crescita dei workload AI rende sempre più difficile mantenere queste separazioni. Comprendere il comportamento di un agente richiede di correlare dati provenienti da domini differenti: log applicativi, trace distribuite, metriche infrastrutturali, eventi di sicurezza, dati relativi ai modelli e informazioni di business. Nessuno di questi elementi è sufficiente da solo.

Il 72% degli intervistati considera ormai superati gli strumenti standalone dedicati esclusivamente al logging. Il valore si sposta progressivamente dalla raccolta dei singoli segnali alla capacità di costruire un contesto operativo unificato, nel quale ogni dato acquisisce significato in relazione agli altri.

L’osservabilità evolve così da insieme di prodotti specializzati a piattaforma condivisa capace di raccogliere, normalizzare e interpretare informazioni provenienti dall’intero ecosistema digitale.

Questa convergenza coinvolge ambiti che fino a pochi anni fa venivano gestiti separatamente: monitoraggio applicativo, infrastrutture cloud, sicurezza operativa, governance dell’intelligenza artificiale e automazione dei processi. La telemetria diventa il punto di incontro tra discipline che in passato utilizzavano strumenti, linguaggi e metriche differenti.

OpenTelemetry e l’intelligenza spostata a monte

OpenTelemetry sta diventando uno degli elementi centrali delle nuove architetture di osservabilità. La crescente diffusione di questo progetto open source promosso dalla Cloud Native Computing Foundation riflette l’esigenza di superare la frammentazione che per anni ha caratterizzato il monitoraggio dei sistemi digitali. Lo standard definisce modalità comuni per raccogliere, descrivere e trasportare log, metriche e trace, consentendo alle organizzazioni di acquisire dati osservativi in modo uniforme indipendentemente dalle tecnologie, dai cloud provider o dagli strumenti utilizzati.

L’approccio basato su un contesto unificato correla log, trace, metriche ed eventi in tempo reale, fornendo la base informativa necessaria per agenti AI affidabili e spiegabili.

La possibilità di utilizzare modelli condivisi per raccogliere e correlare la telemetria riduce la dipendenza da strumenti proprietari e semplifica l’integrazione dei dati provenienti da cloud pubblici, ambienti on-premise, piattaforme SaaS, servizi AI e applicazioni distribuite. In architetture nelle quali applicazioni tradizionali, servizi cloud-native e modelli di intelligenza artificiale convivono all’interno dello stesso ecosistema operativo, la disponibilità di un linguaggio comune per la telemetria diventa un elemento essenziale per costruire una visione coerente del comportamento dei sistemi.

Trasferire, archiviare e processare indiscriminatamente ogni segnale generato dai workload AI sta diventando economicamente e operativamente insostenibile.

Il 90% delle organizzazioni identifica nel filtraggio dei dati inutili prima dell’ingestione una delle principali sfide operative. Parallelamente, l’85% dichiara di avere difficoltà nel gestire l’acquisizione dei log alle scale richieste dai workload AI. La pressione non riguarda soltanto lo storage ma l’intera catena di raccolta, trasporto, elaborazione e analisi della telemetria.

L’intelligenza si sta progressivamente spostando dalle piattaforme di analisi verso le pipeline di raccolta dei dati. Filtrare, arricchire e contestualizzare le informazioni nel momento in cui vengono generate consente di eliminare rumore informativo, ridurre i volumi trasferiti e conservare soltanto i segnali realmente utili alle attività operative.

L’approccio tradizionale privilegiava la raccolta del maggior numero possibile di informazioni per decidere successivamente quali utilizzare. I workload AI richiedono una logica diversa. La capacità di selezionare i dati più rilevanti assume maggiore importanza rispetto alla semplice accumulazione di telemetria.

La qualità del segnale diventa più importante della quantità dei dati raccolti. Come osserva Mala Pillutla, “le organizzazioni vincenti non saranno quelle che raccolgono più informazioni, ma quelle che sanno valorizzare quelle giuste, definite alla fonte e pronte a guidare l’azione”. In un contesto caratterizzato da workload AI sempre più estesi, il vantaggio competitivo si sposta quindi dalla capacità di accumulare telemetria alla capacità di selezionare, contestualizzare e utilizzare i dati realmente rilevanti.

Impatti diversi a seconda dei settori

La pressione esercitata dall’intelligenza artificiale sulle architetture di osservabilità non si distribuisce in modo uniforme tra i diversi comparti economici.

Le organizzazioni che sviluppano software e servizi digitali registrano l’aumento più marcato dei volumi di telemetria associati all’AI, con una crescita media del 127% nell’ultimo anno. L’integrazione dell’intelligenza artificiale direttamente all’interno dei prodotti genera un numero crescente di interazioni, richieste e processi che devono essere monitorati e analizzati.

Telecomunicazioni ed energy & utilities seguono con incrementi superiori al 120%, riflesso di infrastrutture altamente distribuite nelle quali l’AI viene utilizzata per ottimizzare reti, processi operativi e attività di manutenzione.

Nel settore healthcare si registrano i livelli di spesa più elevati per la gestione dei log, superiori a 3,9 milioni di dollari annui. Requisiti normativi stringenti, necessità di tracciabilità e crescente utilizzo dell’intelligenza artificiale alimentano una domanda particolarmente intensa di capacità osservativa.

Il comparto manifatturiero presenta alcune delle maggiori difficoltà nella raccolta e nell’analisi della telemetria generata dai sistemi AI. La coesistenza di macchinari industriali, sistemi legacy, piattaforme cloud e nuove applicazioni basate sull’intelligenza artificiale produce ecosistemi complessi nei quali l’integrazione dei dati rappresenta una sfida significativa.

Il retail prevede invece alcuni dei maggiori incrementi degli investimenti destinati alla gestione della telemetria AI. Personalizzazione dell’esperienza cliente, previsione della domanda, ottimizzazione delle scorte e automazione delle attività commerciali aumentano la necessità di monitorare il comportamento degli algoritmi e garantirne affidabilità e coerenza operativa.

Le differenze tra settori riflettono modelli di adozione differenti dell’intelligenza artificiale, ma convergono verso una stessa esigenza: comprendere e governare sistemi sempre più complessi attraverso una telemetria capace di fornire contesto operativo e visibilità end-to-end.

Dall’osservabilità alle autonomous operations

Log, trace, metriche, eventi di sicurezza e indicatori di business stanno convergendo all’interno di piattaforme capaci di individuare anomalie, ricostruirne le cause e attivare automaticamente azioni correttive. La telemetria non alimenta più soltanto dashboard e attività di troubleshooting. Costituisce la base informativa utilizzata da sistemi sempre più autonomi per prendere decisioni operative.

L’interesse crescente verso correlazione automatica, analisi in tempo reale, monitoraggio del model drift – il progressivo deterioramento dell’accuratezza o dell’affidabilità dei modelli quando cambiano dati, contesto o condizioni operative – e remediation automatizzata riflette una trasformazione che coinvolge direttamente il modo in cui vengono gestite le operazioni IT.

La diffusione degli agenti AI accelera ulteriormente questo processo. Sistemi in grado di interpretare il contesto, individuare anomalie, valutare impatti e coordinare azioni correttive richiedono una base informativa molto più ricca rispetto a quella necessaria per il monitoraggio tradizionale. Senza una telemetria contestualizzata, spiegabile e continuamente aggiornata, l’autonomia operativa rimane inevitabilmente limitata.

L’81% delle organizzazioni considera ormai indispensabili capacità di acquisizione ed elaborazione aperte e automatizzate, in grado di supportare analisi in tempo reale senza i costi e la complessità associati ai modelli tradizionali di indicizzazione e reidratazione dei dati. Parallelamente, il 72% ritiene che i workload AI richiedano piattaforme integrate anziché strumenti dedicati a singoli domini della telemetria.

Correlare automaticamente log, trace, metriche, eventi di sicurezza e dati di business sta diventando una condizione necessaria per comprendere come gli algoritmi prendano decisioni, individuare anomalie prima che producano effetti operativi e verificare che gli agenti mantengano comportamenti coerenti con gli obiettivi definiti dall’organizzazione.

L’intelligenza artificiale sta modificando il ruolo stesso della telemetria. Nei sistemi tradizionali log e metriche venivano utilizzati prevalentemente per diagnosticare problemi dopo che si erano verificati. Nei sistemi agentici la telemetria entra direttamente nel processo decisionale, alimentando monitoraggio continuo, analisi contestuale, automazione e controllo operativo. Comprendere, correlare e utilizzare efficacemente questi dati diventa una delle condizioni necessarie per sfruttare l’intelligenza artificiale in ambienti produttivi complessi. La capacità di costruire osservabilità attorno agli agenti AI, alle loro decisioni e alle loro interazioni con il resto dell’ecosistema digitale rappresenta uno dei passaggi più importanti nella transizione verso infrastrutture e processi sempre più autonomi.

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato sulle novità tecnologiche

iscriviti alla newsletter