Dal cloud all’IA agentica: le nuove sfide dell’osservabilità secondo Dynatrace

Secondo Bernd Greifeneder, CTO & Founder di Dynatrace, l’evoluzione dell’intelligenza artificiale agentica e dei sistemi cloud impone un nuovo paradigma di osservabilità. Sei previsioni tracciano cosa cambierà nel 2026 in termini di governance, resilienza e autonomia operativa.

Previsione 1: l’intelligenza artificiale agentica innesca una nuova era di complessità di sistema

 L’intelligenza artificiale agentica sta introducendo un nuovo livello di interazione tra sistemi. È più potente, ma esponenzialmente più difficile da gestire. Man mano che gli agenti coordinano le attività, scambiano contesto e attivano azioni a valle, anche gli ambienti digitali ben progettati possono trasformarsi in comportamenti imprevedibili. La maggior parte delle organizzazioni non è pronta per questo cambiamento. Senza una solida osservabilità e una governance coerente, questi sistemi diventeranno sempre più difficili da comprendere e controllare.

Si pensi a ogni agente di intelligenza artificiale che agisce autonomamente in base a istruzioni e input non solo umani, ma anche di numerosi agenti di prima e terza parte. Una singola interazione con un cliente potrebbe innescare centinaia di conversazioni in background tra agenti, ognuno dei quali prende la propria iniziativa. I ruoli cambiano a seconda della situazione e alcuni agenti potrebbero dirigerne altri.

Scenari comuni mostrano come funziona questo meccanismo. Quando un veicolo rileva un problema, gli agenti specializzati in determinate attività possono controllare le informazioni del cliente, valutare le opzioni di servizio, stimare le tempistiche e coordinare una risoluzione. Un agente di assistenza viaggi potrebbe fare qualcosa di simile, contattando gli agenti che confrontano i voli, verificano i vantaggi fedeltà, prenotano i trasporti e modificano i piani in tempo reale. In entrambi i casi, molti agenti lavorano dietro le quinte per un unico risultato e le interazioni tra loro possono moltiplicarsi in modi imprevedibili. Ogni agente continua a riferire a un essere umano o a un altro agente, e la responsabilità rimane affidata alla supervisione umana. Questa crescita esponenziale della comunicazione tra agenti non può essere gestita senza osservabilità.

Le organizzazioni che adottano l’IA agentica senza un contesto unificato e chiare barriere di sicurezza dovranno affrontare costi crescenti, comportamenti imprevedibili e rischi più elevati. La sfida non è più quella di migliorare i singoli modelli, ma di gestire la rete di interazioni autonome che si sviluppano in tempo reale. In questa fase successiva, l’osservabilità non è più una funzione di supporto. Diventa il fondamento per ecosistemi agentici sicuri, scalabili e governabili.

Previsione 2: Il percorso verso l’autonomia inizia con una comprovata maturità operativa

Le aziende compiranno passi significativi verso operazioni autonome. Sarà la maturità, non l’ambizione, a determinare chi avrà successo. L’IA non potrà agire in modo indipendente finché i sistemi, l’automazione e i processi sottostanti non saranno stabili, osservabili e ben compresi. I sistemi agentici sono in arrivo, ma prima è necessario che le basi siano solide. Le fasi iniziali dell’automazione sono essenziali, perché evidenziano le lacune nell’accesso ai dati, nelle prestazioni dei servizi e nei segnali contestuali da cui l’IA dipende. Solo quando questi componenti saranno affidabili e disponibili in tempo reale, le operazioni supervisionate e autonome prenderanno piede.

La maggior parte delle aziende seguirà una progressione: inizierà con operazioni preventive, in cui l’IA individua e affronta i problemi di routine prima che causino un impatto. Successivamente, implementerà l’automazione guidata, in cui l’IA propone azioni e gli esseri umani supervisionano ogni fase/decisione dell’IA. Solo dopo aver acquisito fiducia attraverso risultati ripetibili e verificabili, emergerà la piena autonomia, con l’IA che opera entro i limiti e interviene solo quando necessario.

Il percorso verso operazioni completamente autonome sarà graduale. Le organizzazioni che investono ora in flussi di lavoro preventivi e in automazione basata sulle raccomandazioni saranno nella posizione migliore per introdurre funzionalità autonome in modo sicuro e responsabile.

Previsione 3: La resilienza diventa il nuovo parametro di riferimento per l’eccellenza operativa

Bernd Greifeneder, CTO & Founder, Dynatrace
Bernd Greifeneder, CTO & Founder, Dynatrace

La resilienza diventerà la misura determinante delle prestazioni digitali. Man mano che i sistemi diventano più distribuiti e interconnessi, piccoli guasti possono diffondersi rapidamente tra applicazioni, aree cloud, sistemi di pagamento e servizi di terze parti. I leader non tratteranno affidabilità, disponibilità, sicurezza e osservabilità come pratiche separate. Le considereranno come un unico requisito: la capacità di un sistema di assorbire le interruzioni, ripristinarsi rapidamente e mantenere un’esperienza cliente coerente in condizioni di stress.

Una ricerca indipendente da noi commissionata a FreedomPay mostra perché questo cambiamento sta accelerando. I risultati rivelano quanto siano diventati fragili gli ecosistemi digitali e quanto rapidamente i guasti tecnici si trasformino in interruzioni per i clienti e perdite finanziarie. Nel Regno Unito, le interruzioni dei pagamenti mettono a rischio circa 1,6 miliardi di sterline di fatturato annuo. In Francia, la cifra sale a 1,9 miliardi di euro. Un singolo problema di servizio può avere ripercussioni su sistemi e canali connessi, dimostrando quanto siano diventate strettamente interconnesse le operazioni moderne.

I clienti percepiscono immediatamente questi fallimenti. La pazienza inizia a calare entro i primi minuti e molti clienti abbandonano la transazione se il problema persiste per più di quindici minuti. Tuttavia, l’interruzione media dura più di un’ora, il che significa che la maggior parte del danno si è già verificata. Quasi un cliente su tre afferma che un singolo incidente è sufficiente a ridurre la propria fiducia in un’azienda, con i consumatori nativi digitali più giovani ancora più propensi ad abbandonare.

Questo contesto richiede un approccio unificato alla resilienza. Le organizzazioni necessitano di una visibilità condivisa sul comportamento dei servizi, su come si propagano i guasti e su come il ripristino influisce sul percorso del cliente. La resilienza sarà misurata in base al modo in cui i sistemi rispondono sotto stress, non solo in base alle loro prestazioni quando i servizi digitali funzionano come previsto.

Previsione 4: L’affidabilità diventa il fondamento del progresso dell’IA

 Le organizzazioni daranno priorità alla costruzione di fondamenta che rendano i sistemi di IA costantemente affidabili. La prossima fase del progresso dell’IA dipenderà tanto dal fondamento deterministico e dai segnali fattuali quanto dalla potenza generativa dei modelli stocastici. Le aziende stanno riconoscendo che la creatività da sola non è sufficiente. Un’IA affidabile richiede sia input strutturati sia meccanismi che garantiscano che gli output rimangano affidabili.

I sistemi agentici aggiungono un nuovo livello di complessità. Man mano che gli agenti coordinano le attività, scambiano contesto e avviano azioni a valle, anche una piccola incomprensione può propagarsi in tutto il sistema. Una maggiore capacità amplifica questo effetto perché un agente potente può accelerare i risultati e al contempo accelerare un errore. È così che l’allucinazione emerge a livello di sistema, non da un singolo modello difettoso, ma da imprecisioni che si accumulano nelle interazioni tra agenti. Il fondamento deterministico e l’osservabilità end-to-end prevengono tale imprecisione garantendo che gli agenti agiscano in base agli stessi segnali fattuali e rimangano responsabili nei confronti dell’operatore umano.

Uno scenario comune illustra questo aspetto. Un veicolo che rileva un problema può attivare agenti che esaminano i dati del cliente, le informazioni sullo stato del veicolo, identificano le sedi di assistenza, valutano i programmi, stimano i tempi di percorrenza e pianificano l’intero flusso di lavoro per la risoluzione. In ciascun caso, molti agenti collaborano dietro le quinte per produrre un unico risultato. Le organizzazioni che desiderano risultati di intelligenza artificiale trasparenti e affidabili daranno priorità a guardrail deterministici, consentendo ai sistemi agentici di comportarsi in modo sicuro, agire in modo prevedibile e collaborare con chiarezza.

Previsione 5: Collaborazione uomo-macchina come motore di crescita

Nel prossimo anno, la crescita dell’IA agentica porterà a un nuovo modello operativo in cui gli esseri umani definiscono gli obiettivi e l’IA esegue un’esecuzione ben definita. Man mano che i sistemi acquisiscono più contesto e diventano capaci di azioni coordinate, il ruolo umano passerà dall’esecuzione di compiti alla definizione di direzioni, alla fornitura di istruzioni e alla supervisione. Le organizzazioni si affideranno all’IA per analizzare le relazioni, identificare i rischi e avviare azioni sicure, mentre gli esseri umani rimarranno responsabili dei risultati e del giudizio trasversale.

L’IA agentica si comporterà in modo molto simile a uno stagista ad alta velocità. Se gli vengono forniti obiettivi chiari, strumenti e istruzioni efficaci e il contesto giusto, fornirà risultati a una velocità che è difficile per i team raggiungere manualmente. Ma avrà comunque bisogno di una guida. Gli esseri umani definiranno l’obiettivo, interpreteranno i compromessi e prenderanno decisioni laddove l’intento non è chiaro o i risultati sono ambigui. Se qualcosa va storto, la responsabilità ricadrà sull’operatore umano, non sul sistema.

Questo modello operativo aiuterà i team a gestire la complessità in modo più prevedibile. L’intelligenza artificiale si occuperà di compiti ripetitivi o urgenti, mentre gli esseri umani si concentreranno sulle decisioni strategiche e sulla comprensione a livello di sistema. La crescita nell’era agentica deriverà da organizzazioni che combineranno il giudizio umano con l’esecuzione guidata dall’intelligenza artificiale in modo trasparente, governato e allineato agli obiettivi aziendali.

Previsione 6: Convergenza tra team di IA e cloud

L’IA smetterà di operare come disciplina isolata e diventerà una componente normale della delivery di software cloud-native. I team integreranno l’IA nei servizi digitali allo stesso modo in cui integrano database o altri sistemi core. Di conseguenza, l’ingegneria dell’IA, l’ingegneria del cloud, l’SRE e la sicurezza convergeranno in un modello operativo condiviso con pipeline comuni, SLO condivisi e responsabilità unificata per l’intero ciclo di vita dei servizi abilitati dall’IA.

 Questo cambiamento riflette il comportamento attuale del software moderno. Le funzionalità dell’IA influenzano costi, latenza, comportamento e compliance, e questi effetti si estendono all’intero stack. Non possono essere monitorate o gestite in modo isolato. Per funzionare in modo affidabile in produzione, l’IA deve essere eseguita all’interno degli stessi flussi di lavoro, guardrail e pipeline di distribuzione utilizzati per il resto del sistema cloud-native.

L’osservabilità end-to-end diventa essenziale perché ciò che conta è il risultato complessivo per l’utente. Le indicazioni ricevute dagli agenti, le azioni che intraprendono, le chiamate al database che attivano e i costi che sostengono contribuiscono tutti all’esperienza utente complessiva. L’osservabilità deve seguire tutti questi segnali contemporaneamente e trattare i componenti dell’IA, la logica applicativa e l’infrastruttura cloud come un unico sistema interconnesso. Questo elimina la distinzione tra “osservabilità dell’IA” e telemetria tradizionale e crea una visione unificata che si allinea al modo in cui i clienti percepiscono il servizio.

Le organizzazioni che adottano questo modello tratteranno l’IA come un componente software di prima classe. I team centrali definiranno i casi d’uso, stabiliranno stack comuni e garantiranno la conformità, mentre i team di prodotto integreranno l’IA direttamente nelle loro pipeline di distribuzione. Questa convergenza pratica consentirà alle aziende di gestire servizi basati sull’IA con la stessa disciplina e prevedibilità di qualsiasi altro sistema cloud-native.

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato sulle novità tecnologiche

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome