IBM rafforza la propria strategia di cloud ibrido con due nuovi servizi gestiti basati su tecnologie Red Hat, pensati per accompagnare le imprese in due passaggi ormai centrali: portare l’intelligenza artificiale in produzione e modernizzare gli ambienti di virtualizzazione con maggiore controllo operativo.
Le novità sono Red Hat AI Inference on IBM Cloud e Red Hat OpenShift Virtualization Service on IBM Cloud. Il primo servizio punta a semplificare l’esecuzione di carichi di inferenza AI in tempo reale, con controlli di governance integrati e un modello gestito che riduce la complessità legata a GPU, infrastruttura e piattaforme AI. Il secondo offre invece un percorso gestito per migrare ed eseguire macchine virtuali su Red Hat OpenShift, con l’obiettivo di dare alle aziende un ambiente più scalabile, sicuro e prevedibile sul piano dei costi.
IBM Cloud diventa una base gestita per l’AI inference enterprise
La prima novità riguarda uno dei problemi più concreti dell’adozione dell’intelligenza artificiale in azienda: il passaggio dai progetti pilota all’utilizzo continuativo in produzione. Molte organizzazioni hanno già sperimentato modelli generativi, assistenti e agenti AI, ma la fase successiva richiede prestazioni stabili, governance, sicurezza, costi prevedibili e integrazione diretta nei flussi di lavoro esistenti.
Red Hat AI Inference on IBM Cloud nasce per rispondere a questa esigenza. Il servizio combina il motore di inferenza di Red Hat AI con l’infrastruttura IBM Cloud, in una proposta completamente gestita da IBM. L’obiettivo è permettere alle aziende di eseguire modelli AI in produzione senza dover gestire direttamente GPU, tuning dei runtime o complessità piattaformistiche.
Jason McGee, CTO di IBM Cloud, sintetizza così il posizionamento dell’offerta: “Le aziende sono desiderose di rendere operativa l’AI, ma il divario tra sperimentazione e produzione può frenarle. Con Red Hat AI Inference on IBM Cloud, offriamo ai clienti una piattaforma gestita costruita per carichi di lavoro reali, non solo per esperimenti. Allo stesso tempo, la nostra nuova offerta di virtualizzazione su IBM Cloud consente alle imprese di migrare verso un ambiente di virtualizzazione resiliente e orientato alla sicurezza, dando loro la flessibilità di adottare Red Hat OpenShift con i propri tempi per futuri workload AI e percorsi di containerizzazione”.
Red Hat AI Inference punta su prestazioni, governance e costi prevedibili
Il servizio di inferenza AI è pensato per supportare applicazioni e agenti che devono rispondere in tempo reale, con throughput elevato e bassa latenza. La piattaforma è basata su vLLM e sul motore di inferenza di Red Hat AI, con API compatibili OpenAI per rendere più semplice l’integrazione da parte degli sviluppatori.
Il catalogo iniziale dei modelli include Granite 4.0 H Small di IBM, Mistral-Small-3.2-24B-Instruct, Llama 3.3 70B Instruct, GPT-OSS-120B e Nemotron-3-Nano-30B-FP8. IBM prevede inoltre l’arrivo di ulteriori modelli aperti e modelli personalizzati a partire da maggio 2026.
Il punto rilevante, in chiave enterprise, non è solo l’accesso ai modelli. IBM insiste soprattutto sulla possibilità di trasformarli in risorse condivise e accessibili via API, secondo un approccio Models-as-a-Service. Questo significa che team diversi possono utilizzare modelli comuni senza replicare infrastrutture, configurazioni e processi di gestione, riducendo l’onere tecnico e migliorando la coerenza operativa.
Sul piano della governance, Red Hat AI Inference on IBM Cloud integra IBM Cloud IAM, audit logging, controlli di privacy e affidabilità supportata da SLA. Sono elementi centrali per le aziende che vogliono portare l’AI dentro applicazioni mission critical, dove non basta ottenere una risposta dal modello: bisogna sapere chi lo usa, come viene usato, con quali controlli e con quale tracciabilità.
IBM sottolinea inoltre che IBM Cloud è l’unico cloud a offrire un add-on Red Hat AI completamente gestito con accesso alle funzionalità complete di Red Hat AI. È una precisazione importante perché posiziona IBM Cloud non solo come infrastruttura di esecuzione, ma come ambiente gestito per standardizzare orchestrazione, performance e governance dei modelli su scala aziendale.
OpenShift Virtualization su IBM Cloud risponde al ripensamento delle VM
La seconda novità riguarda la virtualizzazione, un tema tornato molto sensibile per molte imprese. Diverse organizzazioni stanno rivalutando le proprie strategie per le macchine virtuali, spinte dalla necessità di ridurre complessità, migliorare la prevedibilità dei costi e costruire un percorso più lineare verso ambienti modernizzati.
Red Hat OpenShift Virtualization Service on IBM Cloud offre una piattaforma gestita per eseguire workload VM su Red Hat OpenShift, sfruttando un’infrastruttura Kubernetes-based. Il servizio gira su IBM Cloud VPC Bare Metal ed è progettato per garantire prestazioni prevedibili, controllo del costo totale di proprietà e una transizione più ordinata da ambienti legacy verso architetture più moderne.
La logica è chiara: non tutte le applicazioni aziendali possono essere containerizzate rapidamente, ma molte imprese vogliono comunque evitare che le VM restino isolate in infrastrutture tradizionali difficili da governare. Portare le macchine virtuali su OpenShift consente di mantenere i workload VM e, allo stesso tempo, prepararli a un futuro percorso di containerizzazione e modernizzazione applicativa.
IBM gestisce il ciclo di vita della piattaforma, inclusi aggiornamenti, patching, recovery automatizzato e remediation dei worker node. Questo permette ai team IT di concentrarsi su macchine virtuali, applicazioni e workload, invece che sulla gestione dell’infrastruttura sottostante.
Il servizio include anche strumenti di migrazione integrati, tra cui Migration Toolkit for Virtualization, pensati per spostare le VM da ambienti legacy riducendo il più possibile le interruzioni operative. A supporto delle migrazioni, IBM richiama anche il ruolo di IBM Technology Expert Labs, IBM Consulting, Red Hat Services e partner system integrator globali.
Una strategia Red Hat più ampia per il cloud ibrido
Le due nuove offerte si inseriscono in un portafoglio già costruito intorno a Red Hat Enterprise Linux, Red Hat OpenShift, Red Hat Ansible Automation Platform e Red Hat AI. IBM sta quindi estendendo il modello dei servizi gestiti Red Hat su IBM Cloud lungo due direzioni complementari: AI in produzione e modernizzazione dell’infrastruttura applicativa.
Ashesh Badani, senior vice president e chief product officer di Red Hat, descrive così il senso della collaborazione: “Questi nuovi servizi gestiti rappresentano il passo successivo nel nostro lavoro con IBM per aiutare le imprese a guidare l’innovazione nell’era dell’AI con una piattaforma di cloud ibrido aperta e coerente. Portando Red Hat AI Inference e Red Hat OpenShift Virtualization Service su IBM Cloud, permettiamo ai clienti di modernizzare con i propri tempi, preparandosi al tempo stesso a un futuro guidato dall’AI”.
Il messaggio è coerente con la strategia storica di IBM sul cloud ibrido: non imporre una sostituzione radicale dell’esistente, ma offrire una piattaforma comune per gestire workload tradizionali, applicazioni containerizzate e nuovi servizi AI. In questo scenario, OpenShift continua a essere il livello di astrazione operativo, mentre IBM Cloud fornisce infrastruttura, servizi gestiti e controlli enterprise.
Disponibilità dei nuovi servizi IBM e Red Hat
Red Hat AI Inference on IBM Cloud sarà generalmente disponibile dal 22 maggio 2026. Red Hat OpenShift Virtualization Service on IBM Cloud è invece già in disponibilità limitata e dovrebbe arrivare alla disponibilità generale nel giugno 2026.
IBM precisa che funzionalità e tempistiche possono variare e che i servizi potrebbero non essere disponibili in tutti i Paesi. Al netto delle cautele tipiche degli annunci di prodotto, la direzione è evidente: IBM vuole rafforzare IBM Cloud come piattaforma gestita per imprese che devono affrontare simultaneamente due transizioni, quella verso l’AI produttiva e quella verso una virtualizzazione più integrata nel cloud ibrido.
Per le aziende, il valore potenziale sta nella possibilità di ridurre l’onere operativo su due fronti complessi. Da un lato, portare modelli AI in produzione con API, governance e prestazioni più prevedibili. Dall’altro, migrare le macchine virtuali verso un ambiente OpenShift gestito, senza dover necessariamente trasformare subito ogni applicazione in container.
È una proposta che non elimina la complessità della modernizzazione, ma prova a spostarla dentro un modello gestito. Ed è esattamente su questo punto che IBM sta costruendo il proprio argomento: aiutare le imprese a innovare senza costringerle a ricominciare da zero.






