Red Hat AI Enterprise e Red Hat AI Factory con NVIDIA: la piattaforma “dal metal all’agent” per l’AI enterprise

25 Febbraio 2026

Red Hat AI Enterprise e Red Hat AI Factory con NVIDIA segnano un passaggio strategico nell’evoluzione dell’AI enterprise: dalla sperimentazione frammentata a una piattaforma unificata, progettata per estendersi dal metal agli agent e supportare workload agentici su scala industriale nell’hybrid cloud.
Red Hat presenta Red Hat AI Enterprise come piattaforma integrata per implementare e gestire modelli, agenti e applicazioni AI attraverso ambienti ibridi. In parallelo, insieme a NVIDIA, annuncia Red Hat AI Factory con NVIDIA, una soluzione co-ingegnerizzata che combina Red Hat AI Enterprise e NVIDIA AI Enterprise in un’offerta end-to-end per organizzazioni che puntano a scalare l’AI in produzione.

Red Hat AI Enterprise: unificare infrastruttura, modelli e agenti

Red Hat AI Enterprise entra a far parte del portfolio Red Hat AI, che include Red Hat AI Inference Server, Red Hat OpenShift AI e Red Hat Enterprise Linux AI, e viene accompagnata dal rilascio di Red Hat AI 3.3, con aggiornamenti estesi all’intero stack.
L’obiettivo dichiarato è fornire uno stack completo “metal-to-agent”, integrando infrastruttura Linux e Kubernetes con capacità avanzate di inferenza e funzionalità agentiche. La piattaforma si fonda su Red Hat OpenShift e su Red Hat Enterprise Linux, estendendo queste basi fino ai modelli e agli agenti che implementano la logica di business.
Joe Fernandes, vice president and general manager, AI Business Unit di Red Hat, afferma: “For AI to deliver true business value, it must be operationalized as a core component of the enterprise software stack, not as a standalone silo.” E aggiunge che la piattaforma è progettata per colmare il divario tra infrastruttura e innovazione, consentendo alle organizzazioni di passare da piloti frammentati a operazioni AI governate e ripetibili su cloud ibrido.
Il contesto è chiaro: l’AI enterprise sta evolvendo da semplici chatbot a workflow agentici autonomi, ad alta densità, che richiedono integrazione profonda con l’intero stack tecnologico. Molte aziende restano bloccate nella fase pilota per via di strumenti disallineati e infrastrutture incoerenti. Red Hat AI Enterprise affronta questo problema unificando ciclo di vita dei modelli e delle applicazioni, trasformando l’AI in un sistema enterprise standardizzato.

Capacità chiave: inferenza, governance e flessibilità hybrid cloud

Red Hat AI Enterprise offre funzionalità centrali per la produzione AI: inferenza ad alte prestazioni, tuning e personalizzazione dei modelli, deployment e gestione di agenti, con supporto a modelli e hardware eterogenei in qualsiasi ambiente.

Tra i benefici evidenziati:
Inferenza più rapida e scalabile grazie all’integrazione del motore vLLM e del framework distribuito llm-d, per ottimizzare l’esecuzione di modelli generativi su hardware ibrido.
Osservabilità e gestione del ciclo di vita integrate, per garantire governance, mitigazione del rischio e interoperabilità su uno stack AI validato per ambienti enterprise.
Flessibilità hybrid cloud, con la possibilità di implementare e gestire modelli e agenti in modo coerente on-premise, nel cloud pubblico o all’edge.

Con Red Hat AI 3.3, l’azienda amplia inoltre l’ecosistema di modelli – incluse versioni validate di Mistral-Large-3, Nemotron-Nano e Apertus-8B-Instruct – introduce una preview di Models-as-a-Service (MaaS) per accesso self-service via API gateway e amplia il supporto hardware, inclusi acceleratori NVIDIA Blackwell Ultra e AMD MI325X. Viene inoltre rafforzata l’osservabilità, con telemetria in tempo reale e integrazione in anteprima di NeMo Guardrails per la sicurezza operativa delle interazioni AI.

Red Hat AI Factory con NVIDIA: software platform per le “AI factory”

Se Red Hat AI Enterprise rappresenta la base unificata, Red Hat AI Factory con NVIDIA ne costituisce l’estensione co-progettata per ambienti di inferenza su larga scala.
La piattaforma combina Red Hat AI Enterprise e NVIDIA AI Enterprise in una soluzione software ottimizzata per infrastrutture di accelerated computing, con supporto Day 0 per le architetture hardware NVIDIA più recenti. È progettata per eseguire workload AI su infrastrutture validate di vendor come Cisco, Dell Technologies, Lenovo e Supermicro.
Justin Boitano, vice president, Enterprise AI Platforms di NVIDIA, sottolinea: “Enterprises are building AI factories that turn data into intelligence at scale during inference, requiring production-grade infrastructure and software that span the hybrid cloud.” Secondo Boitano, la collaborazione fornisce la base software per sostenere innovazione infrastrutturale rapida e nuove applicazioni agentiche.

La piattaforma promette:

Time-to-value accelerato, con accesso a modelli preconfigurati – tra cui IBM Granite, NVIDIA Nemotron e NVIDIA Cosmos – distribuiti come microservizi NVIDIA NIM e ulteriormente adattabili tramite NVIDIA NeMo.
Prestazioni e costi ottimizzati, grazie a uno stack di serving unificato che integra vLLM, NVIDIA TensorRT-LLM e NVIDIA Dynamo, con capacità di osservabilità integrate per rispettare stringenti service level objective AI e ridurre il TCO.
Orchestrazione intelligente delle GPU, con accesso on-demand a risorse condivise e checkpoint automatici per proteggere job di lunga durata e mantenere costi prevedibili in ambienti dinamici.
Postura enterprise rafforzata, sfruttando la base stabile di Red Hat Enterprise Linux e microservizi NVIDIA DOCA per costruire un’architettura zero-trust e garantire sicurezza runtime per workload AI mission-critical.

Verso l’AI come infrastruttura industriale

La convergenza tra Red Hat AI Enterprise e Red Hat AI Factory con NVIDIA risponde a una dinamica chiara: con la spesa enterprise per l’AI destinata a crescere in modo significativo nei prossimi anni, trainata in larga parte da applicazioni agentiche, le organizzazioni cercano piattaforme che uniscano stabilità mission-critical e innovazione di frontiera.
La proposta congiunta punta a fornire una base software industriale per le “AI factory”, dove inferenza, orchestrazione GPU, sicurezza e governance non sono feature accessorie, ma requisiti strutturali. In questo scenario, l’AI non è più un laboratorio sperimentale, ma un carico di lavoro core, gestito con lo stesso rigore operativo delle piattaforme IT enterprise.

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato sulle novità tecnologiche

iscriviti alla newsletter

Red Hat AI Enterprise e Red Hat AI Factory con NVIDIA: la piattaforma “dal metal all’agent” per l’AI enterprise

Red Hat AI Enterprise: unificare infrastruttura, modelli e agenti

Capacità chiave: inferenza, governance e flessibilità hybrid cloud

Red Hat AI Factory con NVIDIA: software platform per le “AI factory”

Verso l’AI come infrastruttura industriale

LASCIA UN COMMENTO Cancella la risposta

Intelligenza artificiale

Google sviluppa un chip AI dedicato a Gemini per ridurre consumi e dipendenza dalle...

F5 rafforza la resilienza informatica nell’era dell’AI con nuove funzionalità di fleet management

Codema lancia due Technical Committee per sviluppare un modello di assessment continuo dell’intelligenza artificiale

Trend

Google DeepMind: il Nobel Demis Hassabis propone un organismo per valutare i modelli AI...

Forward Deployed Engineering, perché le big tech mandano gli ingegneri dentro le aziende

Il Quantum Computing: la tecnologia che sta riscrivendo le nostre possibilità