IBM e NVIDIA accelerano l’AI enterprise con GPU, watsonx.data e infrastrutture sovrane

17 Marzo 2026

IBM amplia la collaborazione con NVIDIA per accelerare l’adozione dell’AI enterprise su scala industriale. L’annuncio, presentato a GTC 2026, mette al centro un punto preciso: molte aziende stanno investendo nell’intelligenza artificiale, ma restano bloccate tra progetti pilota, dati frammentati, infrastrutture non adeguate e vincoli normativi che rallentano il passaggio alla produzione.

IBM e NVIDIA puntano a chiudere il divario tra pilot e produzione AI

La nuova estensione della partnership si muove lungo cinque direttrici: analytics nativi per GPU, estrazione di dati non strutturati, infrastrutture per deployment on-premises e in contesti regolamentati, servizi cloud e consulenza. In altre parole, IBM e NVIDIA provano a costruire una filiera completa per l’AI enterprise, dalla disponibilità del dato fino alla messa in esercizio dei modelli.

Il messaggio strategico è chiaro: nella nuova fase dell’AI non basta più il livello dei modelli. Servono anche un layer dati realmente sfruttabile, infrastrutture progettate per workload avanzati e capacità di orchestrazione che consentano di integrare tutto in ambienti aziendali complessi.

Arvind Krishna, chairman e CEO di IBM, sintetizza così il senso dell’operazione: “Nella prossima ondata di AI enterprise, il layer dei modelli dipenderà dai layer di dati, infrastruttura e orchestrazione, e da aziende capaci di mettere insieme tutti e tre. La nostra partnership con NVIDIA va al cuore di questa sfida. Insieme stiamo offrendo alle imprese le soluzioni necessarie per smettere di sperimentare con l’AI e iniziare a farla funzionare davvero.”

Sulla stessa linea Jensen Huang, fondatore e CEO di NVIDIA, che lega il tema dell’AI direttamente a quello del dato: “IBM ha pionierizzato l’enterprise computing e il data processing sei decenni fa, e oggi li sta ridefinendo per l’era dell’AI. I dati sono il ground truth che dà all’AI contesto e significato. Insieme a IBM stiamo portando l’accelerazione CUDA GPU direttamente nel layer dei dati, trasformando analytics ed elaborazione documentale da colli di bottiglia in motori di intelligence in tempo reale.”

Analytics strutturati più veloci con watsonx.data e accelerazione GPU

Uno dei tasselli più concreti dell’annuncio riguarda l’integrazione open source tra IBM watsonx.data e NVIDIA cuDF. L’obiettivo è aumentare le prestazioni e ridurre i costi nell’analisi di grandi volumi di dati aziendali. In pratica, il motore SQL Presto di watsonx.data viene accelerato dalle librerie GPU di NVIDIA per velocizzare l’esecuzione delle query su dataset di grandi dimensioni.

IBM e NVIDIA hanno validato questo approccio in un contesto reale con Nestlé, applicandolo al data mart globale Order-to-Cash. Si tratta di un ambiente che traccia ordini, evasione, consegne e fatture in 186 Paesi, elaborando terabyte di dati distribuiti su 44 tabelle. Il caso è significativo perché non si parla di laboratorio o benchmark artificiale, ma di un contesto produttivo con dati già consolidati e modelli informativi unificati a livello globale.

Secondo quanto riportato, con infrastruttura CPU il refresh del sistema richiedeva circa 15 minuti e veniva eseguito solo poche volte al giorno. Con il supporto di software NVIDIA e GPU, il motore Presto di watsonx.data ha ridotto il tempo di query a tre minuti, con un risparmio sui costi dell’83% e un miglioramento complessivo di prezzo-prestazioni pari a 30 volte.

Per Nestlé il punto non è soltanto tecnico. Ridurre il tempo di refresh di questi dataset significa accelerare la velocità decisionale su processi globali come manufacturing, warehousing e supply chain. Chris Wright, Chief Information and Digital Officer di Nestlé, spiega che la priorità ora è tradurre questa capacità in impatto di business concreto, estendendola progressivamente all’intera organizzazione.

Dati non strutturati e documenti: il nodo che frena molte iniziative AI

Se sui dati strutturati il problema è spesso la performance, sui contenuti non strutturati il blocco riguarda accessibilità e affidabilità. Molte imprese dispongono già di una grande quantità di informazioni utili, ma queste restano intrappolate in repository documentali, CMS, portali interni, ricerche di vendor o knowledge base di esperti di dominio. Il materiale esiste, ma non è pronto per essere usato da sistemi AI a velocità operativa.

Per questo IBM e NVIDIA lavorano su una combinazione tra Docling di IBM e i modelli open NVIDIA Nemotron. L’idea è industrializzare l’estrazione documentale intelligente: Docling converte e standardizza i documenti in formati AI-ready mantenendo tracciabilità a livello di fonte, mentre i modelli Nemotron accelerano l’ingestione di contenuti multimodali.

Il risultato atteso è una pipeline più efficiente per trasformare documenti eterogenei in dati utilizzabili da applicazioni di AI enterprise, con throughput superiore rispetto ad altri modelli open source e senza sacrificare l’accuratezza, almeno dove sia disponibile un’infrastruttura GPU adeguata.

Infrastruttura AI per ambienti regolamentati, on-premises e cloud

La collaborazione si estende anche allo strato infrastrutturale. NVIDIA ha selezionato IBM Storage Scale System 6000 per fornire 10 petabyte di storage ad alte prestazioni destinato ai propri motori di advanced analytics nativi per GPU. L’infrastruttura abbina il layer di accesso unificato ai dati e l’elevato parallelismo di IBM con le pipeline GPU di NVIDIA.

Il tema non è secondario, perché una parte crescente dei progetti AI enterprise non può appoggiarsi in modo indistinto su cloud generalista. Settori regolamentati, pubblica amministrazione e organizzazioni con forti vincoli di data residency chiedono architetture che tengano insieme potenza di calcolo, governance e conformità.

In questo quadro si inserisce anche l’esplorazione congiunta dell’integrazione tra IBM Sovereign Core e l’infrastruttura NVIDIA con modelli Nemotron, con l’obiettivo di abilitare workload AI ad alta intensità di GPU all’interno di confini regionali definiti. È un passaggio che parla direttamente a mercati come quello europeo, dove sovranità del dato, compliance e controllo territoriale delle informazioni stanno diventando fattori strutturali delle strategie AI.

Blackwell Ultra su IBM Cloud e ruolo centrale di Red Hat e Consulting

Sul fronte cloud, IBM prevede di rendere disponibili le GPU NVIDIA Blackwell Ultra su IBM Cloud all’inizio del secondo trimestre 2026, per training su larga scala, inferenza ad alto throughput e workload di AI reasoning. La tecnologia sarà integrata anche nella Red Hat AI Factory con NVIDIA e nei server VPC con controlli enterprise su compliance e data residency.

Accanto alla componente tecnologica c’è poi quella consulenziale. IBM Consulting intende portare Red Hat AI Factory with NVIDIA ai clienti tramite IBM Consulting Advantage, la piattaforma AI enterprise della società per supportare costruzione, scaling e gestione di progetti AI in ambienti eterogenei. La promessa è semplificare la preparazione dei dati, la costruzione dei modelli e la distribuzione operativa, mantenendo allo stesso tempo maggiore supervisione e controllo.

Perché questa mossa conta davvero per l’AI enterprise

L’elemento più interessante dell’annuncio non è il singolo prodotto, ma il disegno complessivo. IBM e NVIDIA stanno cercando di presidiare il punto in cui oggi molte strategie AI si inceppano: non la qualità del modello in sé, ma l’integrazione tra dato, infrastruttura, governance e capacità esecutiva.

Per le imprese il problema non è più capire se usare l’intelligenza artificiale, ma come farla funzionare in ambienti reali, con sistemi legacy, dati distribuiti, obblighi di compliance e pressioni crescenti sul ritorno degli investimenti. In questo senso, la partnership rafforzata tra IBM e NVIDIA prova a rispondere a una domanda molto concreta del mercato: rendere l’AI enterprise meno dimostrativa e più operativa.

La partita si giocherà sulla capacità di trasformare questi annunci in implementazioni ripetibili, economicamente sostenibili e governabili. Ma il segnale che arriva da GTC 2026 è netto: il futuro dell’AI enterprise passa sempre meno da stack isolati e sempre più da piattaforme integrate capaci di collegare dato, calcolo e governance in un’unica architettura.

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato sulle novità tecnologiche

iscriviti alla newsletter