Red Hat AI 3.4 porta l’AI agentica in produzione nell’hybrid cloud

red hat ai

Red Hat aggiorna la propria piattaforma di intelligenza artificiale con Red Hat AI 3.4, una release pensata per affrontare uno dei passaggi più complessi dell’AI enterprise: portare modelli, workflow agentici e sistemi autonomi fuori dalla fase pilota e dentro ambienti di produzione governati, scalabili e controllabili.

Il punto non è più soltanto costruire applicazioni basate su AI generativa, ma gestire l’intero ciclo operativo dell’intelligenza artificiale in azienda. Con Red Hat AI 3.4, l’obiettivo dichiarato è creare una base unificata “metal-to-agent”, capace di collegare infrastruttura, modelli, inferenza, agenti e governance in un framework coerente per sviluppatori e team operativi.

La piattaforma si inserisce in un contesto in cui molte imprese stanno cercando di superare la logica dei chatbot sperimentali e dei progetti isolati. La nuova fase è quella dei sistemi autonomi, degli agenti AI e dei workload intelligenti che devono agire su dati, strumenti e processi aziendali. Per farlo, però, servono controllo, osservabilità, sicurezza e una gestione più prevedibile dei costi.

Red Hat AI 3.4 affronta il divario tra builder e operatori

Uno dei nodi principali riguarda la distanza tra chi costruisce soluzioni AI e chi deve gestire l’infrastruttura su cui quelle soluzioni girano. Da una parte ci sono sviluppatori, data scientist e team applicativi che vogliono accedere rapidamente a modelli e strumenti. Dall’altra ci sono amministratori e responsabili IT che devono garantire governance, sicurezza, controllo dei consumi e conformità alle policy aziendali.

Red Hat AI 3.4 nasce per ridurre questo attrito. La piattaforma fornisce un framework comune per builder e operatori, con l’obiettivo di evitare che l’innovazione proceda attraverso scorciatoie difficili da governare. Il rischio, in assenza di un modello condiviso, è quello dello shadow AI: progetti, strumenti e accessi che crescono fuori dal controllo dell’IT, con costi imprevedibili e rischi non presidiati.

In questo scenario assume rilievo anche il passaggio da “token consumer” a “token provider”. Per molte organizzazioni significa non limitarsi a consumare servizi AI esterni, ma costruire una capacità interna di erogare modelli, inferenza e agenti in modo controllato, anche per esigenze di AI privata e sovrana.

Red Hat AI 3.4 mette al centro proprio questa trasformazione: offrire una base enterprise per distribuire inferenza scalabile e agenti autonomi, mantenendo al tempo stesso trasparenza operativa e controllo sui rischi.

Dall’inferenza al Model-as-a-Service, Red Hat AI 3.4 punta su governance e scala

Al centro della nuova release c’è il Model-as-a-Service, pensato come punto di accesso unico e governato ai modelli. Gli sviluppatori possono utilizzare modelli selezionati attraverso un’interfaccia coerente, mentre gli amministratori mantengono visibilità sui consumi e possono applicare policy aziendali.

La base tecnica poggia su un’inferenza distribuita ad alte prestazioni, costruita su vLLM e llm-d. L’obiettivo è rendere più efficiente il serving dei modelli in ambienti diversi, coerentemente con l’approccio hybrid cloud di Red Hat.

Questo elemento è rilevante perché la domanda di inferenza non cresce solo con le applicazioni generative tradizionali. Cresce soprattutto con gli agenti AI, che possono richiedere interazioni ripetute con modelli, strumenti, dati e sistemi aziendali. Senza una piattaforma di inferenza efficiente e governata, il rischio è che i costi aumentino rapidamente e che la gestione operativa diventi poco prevedibile.

Red Hat AI 3.4 cerca quindi di combinare prestazioni, accesso controllato e governance. Non è un dettaglio secondario: nelle architetture AI enterprise, l’inferenza diventa una componente infrastrutturale critica, non un servizio accessorio.

AgentOps, tracciamento e identità per rendere governabili gli agenti AI

La parte più significativa della release riguarda gli AgentOps. Red Hat AI 3.4 introduce funzionalità pensate per gestire gli agenti dall’ambiente di sviluppo alla produzione, indipendentemente dal framework utilizzato.

Gli strumenti includono tracing integrato, osservabilità, gestione dell’identità crittografica e lifecycle management. In pratica, la piattaforma punta a rendere più visibile ciò che un agente fa, quali passaggi compie, quali strumenti utilizza e come arriva a un determinato risultato.

È un aspetto cruciale. L’autonomia degli agenti AI può ridurre la visibilità sui processi decisionali e introdurre un nuovo livello di rischio. Se un agente agisce su sistemi aziendali, esegue task, richiama strumenti o manipola dati, l’organizzazione deve poter ricostruire il percorso dell’azione e attribuirla a un’identità verificata.

L’integrazione della gestione dell’identità crittografica va in questa direzione: associare ogni azione a un’entità verificata, così da migliorare attribuzione, auditabilità e controllo. È una prospettiva coerente con l’evoluzione dell’AI enterprise, dove la governance non può più limitarsi al modello, ma deve estendersi al comportamento operativo degli agenti.

“L’era agentica rappresenta un’evoluzione della nostra piattaforma: da esecutore di applicazioni tradizionali a motore di sistemi intelligenti e autonomi”, spiega Joe Fernandes, Vice President e General Manager, AI Business Unit, Red Hat. “Stiamo definendo lo standard aperto per il modo in cui l’impresa esegue l’AI. Fornendo una base hardened metal-to-agent per l’inferenza AI, MaaS e AgentOps, Red Hat offre alle organizzazioni le garanzie operative necessarie per innovare su scala mantenendo un controllo rigoroso.”

Prompt management, evaluation hub e sicurezza integrata

Red Hat AI 3.4 introduce anche nuove funzionalità per collegare dati, modelli e agenti. Tra queste c’è il prompt management, che tratta i prompt come asset di dati di primo livello. È un passaggio importante perché, nei workflow AI, i prompt non sono semplici istruzioni temporanee: possono diventare elementi riutilizzabili, versionabili e soggetti a controllo.

Accanto al prompt management arriva un evaluation hub per valutare accuratezza, qualità, sicurezza e rischio di modelli e agenti. Queste funzionalità sono alimentate da MLflow, che fornisce experiment tracking e artifact management per casi d’uso di AI generativa e AI predittiva.

La piattaforma integra inoltre test di sicurezza automatizzati e attività di red-teaming, sfruttando la tecnologia di Chatterbox Labs e del progetto Garak. L’obiettivo è offrire un percorso più strutturato per verificare modelli, agenti e guardrail prima del passaggio in produzione.

Anche qui il tema è concreto: l’AI aziendale non può essere valutata solo in base alla qualità delle risposte. Deve essere misurata rispetto a sicurezza, affidabilità, rischio, coerenza con le policy e capacità di operare in modo verificabile.

Red Hat AI 3.4 rafforza l’approccio open hybrid cloud all’intelligenza artificiale

Con Red Hat AI 3.4, Red Hat consolida la propria visione dell’AI come estensione naturale dell’open hybrid cloud. L’intelligenza artificiale non viene trattata come un layer separato, ma come un carico di lavoro enterprise che deve essere sviluppato, distribuito, protetto, osservato e gestito lungo l’intero stack.

La disponibilità della release è prevista nelle prossime settimane. Il suo valore andrà misurato soprattutto sulla capacità di rendere l’AI agentica più operativa e meno sperimentale, dando alle imprese strumenti per controllare agenti, modelli, inferenza e costi senza frenare lo sviluppo.

Il messaggio di fondo è chiaro: l’AI agentica può diventare una utility aziendale solo se l’infrastruttura riesce a sostenerla con governance, identità, osservabilità e sicurezza. Red Hat AI 3.4 prova a posizionarsi esattamente su questo terreno, dove la sperimentazione lascia spazio alla produzione e l’autonomia degli agenti deve convivere con il controllo enterprise.

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato sulle novità tecnologiche

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome