Red Hat AI Factory con NVIDIA segna un passo concreto verso un’AI scalabile in produzione, integrando Red Hat AI Enterprise e NVIDIA AI Enterprise in un’unica piattaforma software co-ingegnerizzata. L’obiettivo è chiaro: fornire alle organizzazioni una base unificata per costruire, distribuire e scalare applicazioni abilitate all’intelligenza artificiale su larga scala
Red Hat AI Factory con NVIDIA: architettura AI end-to-end per workload agentici
Presentata come evoluzione della collaborazione tra Red Hat e NVIDIA, la piattaforma nasce per rispondere a uno scenario in cui la spesa enterprise per l’AI è destinata a superare il trilione di dollari entro il 2029, trainata in larga parte da applicazioni di agentic AI
In questo contesto, le aziende stanno spostando le proprie strategie verso workflow agentici ad alta densità, con esigenze crescenti sul piano dell’inferenza e dell’infrastruttura. Red Hat AI Factory con NVIDIA si propone come piattaforma software per le cosiddette AI factory, in esecuzione su infrastrutture di elaborazione accelerata basate su GPU NVIDIA, con l’obiettivo di garantire prestazioni elevate per modelli e stack di inferenza
La soluzione è supportata dall’infrastruttura dei principali produttori di sistemi, tra cui Cisco, Dell Technologies, Lenovo e Supermicro, consentendo ai team IT di gestire e scalare le implementazioni AI con lo stesso rigore operativo applicato ai workload enterprise tradizionali
Chris Wright, chief technology officer e senior vice president, Global Engineering, Red Hat, sottolinea: “Il passaggio dalla sperimentazione AI alla produzione su scala industriale e a livello aziendale richiede un cambiamento profondo nel modo in cui gestiamo lo stack di calcolo AI. Con Red Hat AI Factory con NVIDIA, stiamo accelerando il percorso di implementazione dell’AI per passare rapidamente alla produzione. Sulla base delle nostre comprovate offerte in tema di hybrid cloud, la piattaforma fornisce una base stabile e ad alte prestazioni che consente ai nostri clienti di avere un reale controllo della propria strategia AI e di scalare con lo stesso rigore che applicano alle altre piattaforme IT”
AI scalabile in produzione: time-to-value, TCO e sicurezza
Red Hat AI Factory con NVIDIA integra competenze open source, ingegneria e supporto enterprise per offrire una soluzione scalabile in ambienti on-premise, cloud ed edge
Sul piano operativo, la piattaforma punta ad accelerare il time-to-value grazie a flussi di lavoro semplificati e all’accesso a modelli preconfigurati, inclusi IBM Granite, NVIDIA Nemotron e NVIDIA Cosmos, distribuiti come microservizi NVIDIA NIM. La messa a punto e l’allineamento ai dati aziendali possono essere ulteriormente ottimizzati tramite NVIDIA NeMo, con riduzione di tempi e costi
In termini di costi e prestazioni, lo stack unificato integra funzionalità di osservabilità e capacità di inferenza basate su vLLM, NVIDIA TensorRT-LLM e NVIDIA Dynamo, con l’obiettivo di soddisfare stringenti SLA AI e ridurre il TCO ottimizzando l’interazione tra modelli e GPU
Un ulteriore elemento chiave è l’orchestrazione intelligente delle GPU, che consente l’accesso on-demand alle risorse attraverso infrastrutture in pool, con checkpoint automatici per proteggere processi di lunga durata e mantenere prevedibilità dei costi in ambienti dinamici
Sul fronte della sicurezza, la piattaforma si fonda su Red Hat Enterprise Linux per offrire funzionalità avanzate di conformità e protezione integrate, rafforzate dai microservizi NVIDIA DOCA in un’architettura zero-trust orientata alla sicurezza runtime dei workload AI mission-critical
Leggi tutti i nostri articoli su NVIDIA






