L’intelligenza artificiale generativa sta entrando in una fase molto diversa da quella che aveva accompagnato l’ondata iniziale seguita alla diffusione consumer di ChatGPT. Dopo due anni dominati da sperimentazioni, proof of concept e dimostrazioni tecnologiche, il mercato enterprise sta infatti iniziando a confrontarsi con una questione più concreta e meno spettacolare: trasformare la potenza dei modelli in sistemi realmente utilizzabili all’interno dei processi aziendali, governabili dal punto di vista operativo e sostenibili sotto il profilo economico.
È questa, secondo Gianluca Maruzzella, cofondatore e CEO di indigo.ai, la vera linea di demarcazione che separa la fase pionieristica dell’AI generativa da quella industriale. Se fino a poco tempo fa il problema principale era capire che cosa i modelli fossero in grado di fare, oggi la sfida consiste soprattutto nel renderli affidabili, integrarli nei sistemi aziendali, controllarne il comportamento e inserirli all’interno di processi che producano risultati misurabili.
Maruzzella descrive il momento attuale come una fase di trasformazione profonda, nella quale le aziende più rapide ad adattarsi stanno iniziando a modificare non soltanto gli strumenti tecnologici, ma il proprio modo di lavorare. “Si sta riscrivendo piano piano il DNA delle aziende più coraggiose”, osserva, spiegando che il 2024 è stato soprattutto l’anno delle sperimentazioni, mentre soltanto nel 2025 le organizzazioni più strutturate e più coraggiose hanno iniziato a mettere a budget progetti consistenti e a vederne quest’anno i primi risultati concreti. Secondo Maruzzella, la differenza rispetto alla fase iniziale è che “adesso la vera battaglia su come questa cosa possa essere implementata in contesto enterprise si basa soprattutto sulla fiducia nei risultati, nelle persone che governano il processo e nella capacità di generare outcome sostenibili dal punto di vista del business”.
Dall’università alla costruzione di assistenti virtuali
La storia di indigo.ai nasce da un episodio molto concreto. Maruzzella racconta che l’idea iniziale prese forma durante il periodo universitario, davanti alla difficoltà di parlare con la segreteria e ottenere risposte rapide. “Non riuscivo a parlare con l’università”, ricorda, spiegando che proprio da quella frustrazione nacque una domanda più ampia: che cosa succederebbe se fosse possibile cambiare il modo in cui le organizzazioni, non soltanto le università, gestiscono le relazioni con le persone?
Nello stesso periodo iniziavano a maturare le basi tecnologiche che avrebbero poi portato alla rivoluzione dei transformer. Maruzzella ricorda in particolare l’impatto del paper “Attention Is All You Need”, definendolo il lavoro che “avrebbe cambiato il mondo”. Maruzzella richiama il paper Attention Is All You Need, che ha introdotto l’architettura Transformer come uno degli elementi di contesto che, a posteriori, hanno reso possibile l’evoluzione successiva della conversational AI.
Indigo.ai nasce circa nove anni fa, in un mercato molto diverso da quello attuale. All’inizio l’azienda lavorava già con clienti enterprise, in un contesto in cui molti progetti di assistenti virtuali erano legati a iniziative di innovazione, spesso basate su IBM watson e implementate da system integrator. In quella fase, spiega Maruzzella, il vantaggio competitivo non era ancora nella potenza dei modelli, ma nella capacità di costruire algoritmi più efficaci per l’italiano e soprattutto di organizzare correttamente i dati.
Il punto è rimasto lo stesso anche negli anni successivi: un assistente virtuale funziona se è stato progettato bene, alimentato con dati corretti e inserito in un processo gestito. “Il progetto dipendeva da come organizzavi i dati: se li organizzavi bene funzionava, se no non funzionava”, sintetizza. La tecnologia sottostante è cambiata profondamente, ma la natura del problema è rimasta sorprendentemente stabile.
Dal modello consulenziale alla piattaforma di prodotto
Un passaggio importante arriva nel 2019, quando indigo.ai decide di non operare più come società di consulenza e avvia una trasformazione verso un modello di prodotto. “Dato che il progetto era sempre lo stesso, tanto valeva industrializzarlo”, osserva Maruzzella. L’azienda aveva già lavorato con clienti come Bayer, Santander e altre grandi organizzazioni, maturando la convinzione che i progetti seguissero dinamiche ricorrenti.
Secondo Maruzzella, il problema da risolvere era sempre lo stesso: costruire, migliorare e governare il modo in cui un’azienda prepara il lancio di un assistente virtuale, gestendo dati, conversazioni, manutenzione e performance nel tempo.
Già nel 2020, racconta, i clienti di indigo.ai utilizzavano GPT-3.5 in piattaforma e funzionalità che oggi verrebbero ricondotte alla generative AI, prima ancora che questa espressione diventasse di uso comune. “I nostri clienti utilizzavano già strumenti che oggi definiremmo AI generativa”, osserva Maruzzella, sottolineando come l’arrivo di ChatGPT abbia cambiato soprattutto la percezione del mercato. L’arrivo di ChatGPT non ha quindi cambiato radicalmente il punto di vista tecnologico interno all’azienda, ma ha modificato in modo drastico la percezione del mercato. Le imprese si sono accorte improvvisamente della potenza dei modelli linguistici, ma anche del fatto che trasformare quella potenza in applicazioni enterprise richiede piattaforme, governance, controllo delle risposte e riduzione del rischio di allucinazioni.
Oggi indigo.ai conta circa cinquanta persone, ha raccolto circa una decina di milioni di euro, anche da Azimut e sta lavorando all’espansione del prodotto e della propria presenza anche oltre confine.
Perché tanti progetti AI non arrivano in produzione
Una quota molto elevata dei progetti di AI generativa continua a non arrivare mai a deployment reali: che si parli dell’80% o del 90%, il dato preciso conta relativamente, perché ciò che emerge è soprattutto la difficoltà delle aziende nel trasformare una demo funzionante in un’infrastruttura operativa.
Secondo il CEO di indigo.ai, molte iniziative sono nate in un contesto di forte entusiasmo tecnologico e sono state impostate più come esercizi esplorativi che come sistemi destinati a entrare realmente nei processi aziendali. È relativamente semplice costruire una dimostrazione efficace in grado di produrre una buona risposta durante un test controllato; molto più complesso è assicurarsi che quell’agente continui a fornire risposte corrette nel tempo, con i dati giusti, nel contesto corretto e con livelli adeguati di controllo, governance e sicurezza. “Una demo si può fare”, sintetizza Maruzzella, “ma lo sforzo di portare quella cosa in produzione è completamente diverso”.
A complicare ulteriormente il quadro c’è il ritmo con cui evolve il mercato dei modelli. “Ogni pochi mesi cambia tutto, perché arriva un modello più potente”, osserva Maruzzella, Ogni pochi mesi arrivano nuove generazioni di LLM più potenti, più veloci o meno costose, e questo porta molte aziende a rimandare continuamente le decisioni strategiche nell’attesa di una stabilizzazione che, di fatto, non arriva mai. Per Maruzzella, però, proprio questa instabilità rende necessario imparare a progettare sistemi capaci di evolvere continuamente, invece di aspettare un momento di equilibrio destinato probabilmente a non esistere.
La tecnologia diventa un prerequisito, il valore si sposta sulla messa a terra
Nella lettura di Maruzzella, la disponibilità della tecnologia sta progressivamente diventando un requisito di base. “La tecnologia, ormai, è quasi un prerequisito”, osserva Maruzzella, spiegando che il vero elemento distintivo non è più l’accesso ai modelli più avanzati, ma la capacità di integrarli nei processi aziendali e trasformarli in risultati concreti.
La vera battaglia si sposta sulla capacità di adattare i modelli al contesto aziendale, costruire processi di governance, misurare i risultati e generare fiducia negli stakeholder che devono utilizzare o supervisionare questi sistemi. “Gran parte della partita si gioca sulla fiducia”, afferma il CEO di indigo.ai.
In Italia, sostiene Maruzzella, finalmente stanno accadendo molte cose. Indigo.ai può contare su centinaia di referenze che, nella sua lettura, rientrano in quella quota minoritaria di progetti capaci di arrivare davvero a buon fine. Ma il lavoro da fare resta ampio, perché il passaggio dalla sperimentazione alla trasformazione organizzativa richiede competenze, strumenti e soprattutto coraggio manageriale.
L’AI cambia anche il modo in cui si produce software
L’impatto dell’intelligenza artificiale non riguarda soltanto i prodotti offerti ai clienti, ma anche il modo in cui le aziende tecnologiche lavorano internamente. Maruzzella cita l’evoluzione della scrittura del codice come uno degli esempi più evidenti: l’uso dell’AI nello sviluppo software ha aumentato in modo significativo la velocità di produzione.
Il punto, però, non è sostituire il processo di engineering con strumenti generativi lasciati senza controllo. “Adesso è obbligatorio scrivere codice tramite le AI”, afferma Maruzzella, spiegando però che gli strumenti devono essere inseriti all’interno di una precisa meccanica di processo. Gli sviluppatori devono sapere che cosa stanno facendo, mentre l’AI deve essere inserita in una meccanica di processo. “Non basta introdurre strumenti AI nei processi”, osserva Maruzzella, “serve anche la capacità di governarli e capire realmente che cosa stanno facendo”. Per ora, osserva Maruzzella, il beneficio principale è la velocità: a parità di competenze e di base codice interna, l’AI consente di accelerare in modo clamoroso la produzione.
Che cosa distingue davvero un agente AI
Il termine agente è diventato centrale nel dibattito sull’intelligenza artificiale, ma Maruzzella invita a non considerarlo una novità assoluta dal punto di vista tecnologico. Molte delle componenti oggi associate agli agenti erano già disponibili da anni; ciò che è cambiato è il confezionamento del prodotto, la risonanza del mercato e la capacità dei modelli probabilistici di rendere più accessibili questi scenari. Secondo Maruzzella, la novità introdotta dal mercato consumer non è tanto tecnologica quanto culturale: alcune piattaforme hanno reso più comprensibili e visibili concetti che esistevano già, come memoria, continuità operativa e proattività degli agenti. “Dal punto di vista tecnologico molte di queste capacità esistevano già”, osserva Maruzzella, “la differenza è che sono diventate accessibili al mercato consumer”.
Per il CEO di indigo.ai, un agente AI non è semplicemente un chatbot più evoluto, ma un sistema capace di mantenere contesto e memoria, operare in modo continuativo, delegare attività ad altri sistemi e seguire regole di comportamento definite. La vera differenza rispetto al software tradizionale è che questi sistemi operano su basi probabilistiche e non deterministiche: per questo, osserva Maruzzella, diventa fondamentale costruire meccanismi di controllo e fiducia che permettano alle aziende di governarne comportamento, dati e perimetro operativo.
In questa prospettiva, il problema non è soltanto rendere un agente capace di parlare con un utente, ma costruire intorno a lui un sistema di controllo, supervisione e miglioramento continuo.
Agenti che controllano altri agenti
Una delle evoluzioni più rilevanti riguarda gli agenti che non parlano direttamente con le persone, ma supervisionano altri agenti. Presentati in occasione del Netcomm Forum 2026 e attualmente ancora in versione beta, i Self-Improving Agents rappresentano una delle direttrici su cui indigo.ai sta investendo maggiormente.
L’idea è aggiungere un ulteriore livello di intelligenza artificiale al sistema conversazionale: non agenti progettati per dialogare con clienti o dipendenti, ma agenti che osservano il comportamento degli altri agenti AI, ne monitorano le conversazioni e analizzano la qualità delle interazioni generate.
Questi sistemi leggono automaticamente le conversazioni, estraggono pattern ricorrenti, identificano risposte mancanti o inefficaci e riconoscono eventuali variazioni di contesto che potrebbero richiedere modifiche operative. Conoscendo anche la struttura degli altri agenti presenti in piattaforma, sono in grado di formulare suggerimenti specifici destinati ai manager o ai team di customer success.
Il funzionamento descritto da Maruzzella punta a trasformare l’AI conversazionale in un sistema capace di migliorarsi progressivamente nel tempo. “Leggono tutte le conversazioni, estraggono pattern ricorrenti e propongono modifiche”, spiega. A fine giornata, gli agenti di supervisione analizzano ciò che è accaduto nelle conversazioni, valutano ciò che ha funzionato meglio, individuano criticità ricorrenti e propongono interventi finalizzati ad aumentare qualità delle risposte, produttività e risultati operativi.
La logica resta però rigorosamente human-in-the-loop. Gli agenti possono suggerire modifiche, ma non applicarle autonomamente: la decisione finale rimane sempre in mano alle persone. “L’automazione può migliorare il sistema”, osserva Maruzzella, “ma il controllo finale deve rimanere alle persone, perché qualcuno deve verificare i risultati prodotti dagli agenti”. Secondo Maruzzella, è proprio questo equilibrio tra automazione e supervisione umana a generare fiducia nelle organizzazioni enterprise, dove il controllo dei risultati continua a essere considerato un elemento imprescindibile.
Costi, modelli e controllo dell’infrastruttura AI
Il tema dei costi è destinato a diventare sempre più centrale. Maruzzella accetta il parallelo con il cloud computing: anche il cloud era stato adottato inizialmente come strumento più flessibile ed economico, ma nel tempo le aziende hanno scoperto la necessità di piattaforme e pratiche per controllarne i costi. Con l’AI generativa, il tempo tra l’adozione e la consapevolezza del rischio di esplosione dei costi è stato ancora più breve. “L’intervallo di tempo tra usarlo e accorgersi che i costi possono esplodere è stato molto più breve”, osserva Maruzzella.
La risposta non consiste semplicemente nel scegliere sempre il modello più potente. “Per fare la stragrande maggioranza delle conversazioni non serve necessariamente il modello più intelligente”, osserva Maruzzella, Al contrario, per molte conversazioni non serve necessariamente il modello più intelligente o più costoso. Occorre selezionare lo strumento giusto per il compito giusto, distinguendo tra modelli large, medium, small e modelli più specializzati su domini ridotti, con costi di training e inferenza inferiori.
Per Maruzzella questa scelta incide su tre dimensioni: costi, esperienza utente e rischio di allucinazioni. Un modello troppo grande può introdurre latenza, risposte più lente e costi non necessari; un modello non adeguatamente controllato può generare risposte fuori perimetro. La piattaforma deve quindi essere in grado di spacchettare il problema e assegnare ogni richiesta al modello più adatto. Maruzzella descrive questo paradigma come un approccio multi-agent, nel quale un agente orchestratore scompone la domanda e distribuisce le diverse parti agli agenti più pertinenti, riducendo costi, latenza e rischio di allucinazioni.
Il nodo dei dati legacy
Nel mercato enterprise italiano resta centrale il problema dei dati distribuiti su sistemi legacy. Maruzzella conferma che, lavorando con aziende grandi o medio-grandi, può capitare di incontrare sistemi storici, architetture molto complesse e ambienti in cui i dati sono ancora custoditi in infrastrutture obsolete.
Il punto, però, non è addestrare i modelli su dati casuali o trasferire indiscriminatamente informazioni nei sistemi AI. “I dati non servono per educare i modelli”, osserva Maruzzella, “ma per dare il dato corretto al momento corretto”. Gli agenti devono poter accedere agli stessi dati che avrebbe a disposizione un operatore umano, per esempio in un contact center. Devono recuperarli in modo istantaneo, con sicurezza, correttezza e pertinenza rispetto alla richiesta.
Secondo Maruzzella, rendere accessibili questi dati è quasi sempre possibile, ma richiede fondamenta corrette. “Il punto non è addestrare nuovamente i modelli”, spiega Maruzzella, “ma fare in modo che l’agente riceva il dato corretto nel momento giusto”. Non significa necessariamente rifare tutta l’infrastruttura: spesso occorre costruire i layer necessari per rendere raggiungibile il dato, rispettando vincoli di sicurezza, policy della casa madre e complessità organizzative internazionali.
Dal CRM al sistema operativo conversazionale
Quando il discorso si sposta sugli agenti autonomi e sul loro impatto sul commercio digitale, Maruzzella propone una lettura più ampia: indigo.ai sta costruendo una sorta di sistema operativo conversazionale per conto delle aziende.
Il riferimento è al superamento di una logica tradizionale di CRM, basata su campagne, segmentazioni e comunicazioni via email. In uno scenario agentico, il rapporto tra cliente e azienda può passare attraverso un layer conversazionale che ingloba canali diversi: chat, WhatsApp, voce, interazioni automatiche e azioni operative.
L’utente, o in prospettiva un agente personale per conto dell’utente, non si limita a ricevere una comunicazione, ma può conversare con l’azienda e attivare azioni. “Creiamo una sorta di sistema operativo conversazionale per conto delle aziende”, sintetizza Maruzzella, Il passaggio successivo sarà la comunicazione tra agenti: un agente personale che dialoga con gli agenti delle aziende, secondo protocolli ancora in evoluzione ma già visibili nei primi segnali del mercato. “Stiamo iniziando a vedere i primi segnali concreti di questa evoluzione”, osserva Maruzzella.
Per Maruzzella, questi sono i primi segnali di un cambiamento più profondo, destinato a ridefinire l’interfaccia tra persone, imprese e servizi digitali.
Il voice AI come nuova frontiera enterprise
Tra le aree di maggiore crescita per indigo.ai c’è il voice AI, che secondo Maruzzella rappresenta oggi uno degli ambiti più promettenti nel mercato italiano. La ragione è legata soprattutto alla struttura storica delle aziende, ancora fortemente organizzate attorno al customer care telefonico e alla relazione umana mediata dalla voce.
Per questo motivo, osserva il manager, una parte crescente dei progetti sviluppati dall’azienda ruota proprio intorno agli agenti vocali. “Una parte enorme dei progetti su cui stiamo lavorando riguarda ormai la voce”, spiega Maruzzella, sottolineando come il customer care telefonico resti ancora il punto di contatto dominante in molte organizzazioni italiane. In molti casi il numero di telefono continua a essere il principale punto di accesso al servizio clienti e diventa quindi naturale intervenire lì, automatizzando almeno parte delle interazioni senza rinunciare alla qualità dell’esperienza.
La voce, però, introduce complessità molto superiori rispetto a quelle della chat testuale, perché richiede pipeline tecnologiche estremamente ottimizzate e un livello di controllo più difficile da ottenere. “La pipeline deve essere estremamente ottimizzata”, osserva Maruzzella, “perché sulla voce la latenza diventa un elemento fondamentale dell’esperienza”.
Nel contesto enterprise, spiega Maruzzella, lo standard passa ancora spesso da una pipeline articolata basata su speech-to-text, elaborazione nella piattaforma e text-to-speech. Questa pipeline deve essere estremamente ottimizzata, perché l’esperienza deve risultare fluida, naturale e immediata.
Indigo.ai ha già lavorato su iniziative pubbliche legate alla voce, inclusa una campagna realizzata con il supporto di Hotwire per annunciare l’integrazione dell’agente con la telefonia: invece di limitarsi a comunicarla, l’azienda ha messo a disposizione un numero telefonico per permettere agli utenti di provare direttamente l’esperienza.
Latenza, trascrizione e controllo: perché la voce è più difficile della chat
Il problema, però, non riguarda soltanto la qualità del modello linguistico. Nelle interazioni vocali entrano infatti in gioco molti più elementi rispetto a una conversazione testuale: qualità dell’audio, accuratezza della trascrizione, gestione dei turni di parola, trasformazione della voce, distanza geografica dell’infrastruttura e tempi necessari per elaborare ogni singolo scambio.
Secondo Maruzzella, è proprio questa stratificazione tecnologica a rendere il voice AI particolarmente delicato nei contesti enterprise, dove anche pochi secondi di ritardo possono compromettere la naturalezza della conversazione. “La pipeline deve essere estremamente ottimizzata”, osserva, “perché sulla voce la latenza diventa un elemento fondamentale dell’esperienza”.
Il confronto con alcune soluzioni voice-to-voice di nuova generazione viene utilizzato dal CEO di indigo.ai per spiegare quanto il problema sia ancora aperto. Da un lato questi sistemi mostrano capacità linguistiche sempre più sofisticate, dall’altro introducono nuove criticità legate alla latenza, alla verbosità delle risposte e alla difficoltà di mantenere un controllo rigoroso del comportamento dell’agente.
Maruzzella sottolinea come, nei test effettuati dall’azienda, alcune piattaforme completamente vocali possano risultare meno fluide del previsto proprio a causa del numero di trasformazioni necessarie durante la conversazione. Ogni passaggio aggiuntivo – dalla trascrizione alla sintesi vocale – aumenta il rischio di errore e rende il sistema più sensibile alle imperfezioni dell’audio.
Maruzzella sottolinea come i sistemi vocali siano molto più sensibili agli errori di trascrizione rispetto alle interfacce testuali: anche un’imprecisione minima nel riconoscimento dell’audio può compromettere la qualità della risposta generata dall’agente.
Il problema si amplifica ulteriormente nei progetti internazionali, dove la chiamata deve attraversare più infrastrutture distribuite geograficamente. In questi casi, anche il semplice tempo necessario per trasferire la voce da un continente all’altro può introdurre ritardi percepibili dall’utente finale, soprattutto in conversazioni molto dinamiche.
Per questo motivo indigo.ai continua a privilegiare, in molti scenari enterprise, architetture basate su speech-to-text e text-to-speech tradizionali, considerate oggi più controllabili rispetto ad approcci completamente voice-to-voice. La direzione evolutiva resta chiara, ma secondo Maruzzella il mercato non ha ancora raggiunto un equilibrio ottimale tra naturalezza dell’interazione, velocità di risposta e affidabilità operativa.
La governance come condizione per la fiducia
Molte aziende stanno finalmente iniziando a comprendere il potenziale dell’intelligenza artificiale generativa, ma si trovano ancora in una fase di forte incertezza rispetto alle piattaforme da adottare, ai modelli organizzativi da costruire e ai criteri con cui valutare il successo dei progetti. Secondo Maruzzella, “gran parte della partita si gioca sulla fiducia”, perché le imprese non cercano soltanto modelli avanzati, ma partner in grado di garantire controllo, governance ed esperienza concreta nella gestione di sistemi enterprise.
La fiducia, in questo scenario, non riguarda soltanto la reputazione del fornitore, ma anche la qualità dei dati, la capacità di controllare i costi, ridurre le allucinazioni, supervisionare i risultati e integrare gli agenti AI all’interno di processi realmente sostenibili. È questo, nella lettura di Maruzzella, il passaggio che separa una semplice sperimentazione tecnologica da una piattaforma AI realmente integrata nell’organizzazione.
Verso ecosistemi di agenti autonomi
Guardando ai prossimi anni, Maruzzella immagina un’evoluzione progressiva verso ecosistemi composti da agenti sempre più autonomi e interconnessi, capaci di dialogare non soltanto con le persone ma anche tra loro. L’idea è che il rapporto tra utenti, aziende e servizi digitali venga progressivamente mediato da agenti personali in grado di conversare con gli agenti delle organizzazioni, recuperare informazioni, eseguire operazioni e coordinare attività in modo sempre più automatizzato.
“Stiamo iniziando a vedere i primi segnali concreti di questa evoluzione”, osserva Maruzzella, sottolineando come il cambiamento non riguarderà soltanto le interfacce, ma l’intera struttura dei processi aziendali. In questa prospettiva, customer care, CRM, commercio digitale e automazione operativa tenderanno progressivamente a convergere dentro piattaforme conversazionali pervasive, nelle quali gli agenti AI non saranno più semplici strumenti di supporto, ma componenti strutturali dell’organizzazione.
La velocità dell’evoluzione tecnologica, tuttavia, non elimina la necessità di costruire governance, processi e supervisione. Per Maruzzella, il vantaggio competitivo non dipenderà dalla semplice disponibilità dei modelli più avanzati, ma dalla capacità delle aziende di integrarli realmente nelle proprie operation, controllarne comportamento e costi e trasformarli in sistemi affidabili nel tempo.








