Red Hat AI Enterprise e Red Hat AI Factory con NVIDIA: la piattaforma “dal metal all’agent” per l’AI enterprise

red hat nvidia

Red Hat AI Enterprise e Red Hat AI Factory con NVIDIA segnano un passaggio strategico nell’evoluzione dell’AI enterprise: dalla sperimentazione frammentata a una piattaforma unificata, progettata per estendersi dal metal agli agent e supportare workload agentici su scala industriale nell’hybrid cloud.
Red Hat presenta Red Hat AI Enterprise come piattaforma integrata per implementare e gestire modelli, agenti e applicazioni AI attraverso ambienti ibridi. In parallelo, insieme a NVIDIA, annuncia Red Hat AI Factory con NVIDIA, una soluzione co-ingegnerizzata che combina Red Hat AI Enterprise e NVIDIA AI Enterprise in un’offerta end-to-end per organizzazioni che puntano a scalare l’AI in produzione.

Red Hat AI Enterprise: unificare infrastruttura, modelli e agenti

Red Hat AI Enterprise entra a far parte del portfolio Red Hat AI, che include Red Hat AI Inference Server, Red Hat OpenShift AI e Red Hat Enterprise Linux AI, e viene accompagnata dal rilascio di Red Hat AI 3.3, con aggiornamenti estesi all’intero stack.
L’obiettivo dichiarato è fornire uno stack completo “metal-to-agent”, integrando infrastruttura Linux e Kubernetes con capacità avanzate di inferenza e funzionalità agentiche. La piattaforma si fonda su Red Hat OpenShift e su Red Hat Enterprise Linux, estendendo queste basi fino ai modelli e agli agenti che implementano la logica di business.
Joe Fernandes, vice president and general manager, AI Business Unit di Red Hat, afferma: “For AI to deliver true business value, it must be operationalized as a core component of the enterprise software stack, not as a standalone silo.” E aggiunge che la piattaforma è progettata per colmare il divario tra infrastruttura e innovazione, consentendo alle organizzazioni di passare da piloti frammentati a operazioni AI governate e ripetibili su cloud ibrido.
Il contesto è chiaro: l’AI enterprise sta evolvendo da semplici chatbot a workflow agentici autonomi, ad alta densità, che richiedono integrazione profonda con l’intero stack tecnologico. Molte aziende restano bloccate nella fase pilota per via di strumenti disallineati e infrastrutture incoerenti. Red Hat AI Enterprise affronta questo problema unificando ciclo di vita dei modelli e delle applicazioni, trasformando l’AI in un sistema enterprise standardizzato.

Capacità chiave: inferenza, governance e flessibilità hybrid cloud

Red Hat AI Enterprise offre funzionalità centrali per la produzione AI: inferenza ad alte prestazioni, tuning e personalizzazione dei modelli, deployment e gestione di agenti, con supporto a modelli e hardware eterogenei in qualsiasi ambiente.

  • Tra i benefici evidenziati:
    Inferenza più rapida e scalabile grazie all’integrazione del motore vLLM e del framework distribuito llm-d, per ottimizzare l’esecuzione di modelli generativi su hardware ibrido.
  • Osservabilità e gestione del ciclo di vita integrate, per garantire governance, mitigazione del rischio e interoperabilità su uno stack AI validato per ambienti enterprise.
  • Flessibilità hybrid cloud, con la possibilità di implementare e gestire modelli e agenti in modo coerente on-premise, nel cloud pubblico o all’edge.

Con Red Hat AI 3.3, l’azienda amplia inoltre l’ecosistema di modelli – incluse versioni validate di Mistral-Large-3, Nemotron-Nano e Apertus-8B-Instruct – introduce una preview di Models-as-a-Service (MaaS) per accesso self-service via API gateway e amplia il supporto hardware, inclusi acceleratori NVIDIA Blackwell Ultra e AMD MI325X. Viene inoltre rafforzata l’osservabilità, con telemetria in tempo reale e integrazione in anteprima di NeMo Guardrails per la sicurezza operativa delle interazioni AI.

Red Hat AI Factory con NVIDIA: software platform per le “AI factory”

Se Red Hat AI Enterprise rappresenta la base unificata, Red Hat AI Factory con NVIDIA ne costituisce l’estensione co-progettata per ambienti di inferenza su larga scala.
La piattaforma combina Red Hat AI Enterprise e NVIDIA AI Enterprise in una soluzione software ottimizzata per infrastrutture di accelerated computing, con supporto Day 0 per le architetture hardware NVIDIA più recenti. È progettata per eseguire workload AI su infrastrutture validate di vendor come Cisco, Dell Technologies, Lenovo e Supermicro.
Justin Boitano, vice president, Enterprise AI Platforms di NVIDIA, sottolinea: “Enterprises are building AI factories that turn data into intelligence at scale during inference, requiring production-grade infrastructure and software that span the hybrid cloud.” Secondo Boitano, la collaborazione fornisce la base software per sostenere innovazione infrastrutturale rapida e nuove applicazioni agentiche.

La piattaforma promette:

  • Time-to-value accelerato, con accesso a modelli preconfigurati – tra cui IBM Granite, NVIDIA Nemotron e NVIDIA Cosmos – distribuiti come microservizi NVIDIA NIM e ulteriormente adattabili tramite NVIDIA NeMo.
  • Prestazioni e costi ottimizzati, grazie a uno stack di serving unificato che integra vLLM, NVIDIA TensorRT-LLM e NVIDIA Dynamo, con capacità di osservabilità integrate per rispettare stringenti service level objective AI e ridurre il TCO.
  • Orchestrazione intelligente delle GPU, con accesso on-demand a risorse condivise e checkpoint automatici per proteggere job di lunga durata e mantenere costi prevedibili in ambienti dinamici.
  • Postura enterprise rafforzata, sfruttando la base stabile di Red Hat Enterprise Linux e microservizi NVIDIA DOCA per costruire un’architettura zero-trust e garantire sicurezza runtime per workload AI mission-critical.

Verso l’AI come infrastruttura industriale

La convergenza tra Red Hat AI Enterprise e Red Hat AI Factory con NVIDIA risponde a una dinamica chiara: con la spesa enterprise per l’AI destinata a crescere in modo significativo nei prossimi anni, trainata in larga parte da applicazioni agentiche, le organizzazioni cercano piattaforme che uniscano stabilità mission-critical e innovazione di frontiera.
La proposta congiunta punta a fornire una base software industriale per le “AI factory”, dove inferenza, orchestrazione GPU, sicurezza e governance non sono feature accessorie, ma requisiti strutturali. In questo scenario, l’AI non è più un laboratorio sperimentale, ma un carico di lavoro core, gestito con lo stesso rigore operativo delle piattaforme IT enterprise.

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato sulle novità tecnologiche

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome