IBM Think 2026, watsonx.data accelera analytics e AI con le GPU

5 Maggio 2026

IBM Think 2026 porta l’accelerazione GPU dentro IBM watsonx.data con una private technical preview pensata per affrontare uno dei problemi più concreti dell’AI enterprise: il costo crescente delle analisi e dei workload data-intensive su larga scala. IBM punta a spostare una parte rilevante dell’elaborazione delle query dalle CPU alle GPU, con l’obiettivo di ottenere prestazioni superiori, ridurre i tempi di esecuzione e abbassare il costo operativo senza costringere le aziende a riscrivere query, migrare dati o riprogettare le pipeline esistenti.

IBM Think 2026, watsonx.data porta l’accelerazione GPU nelle analytics enterprise

L’annuncio della private technical preview del query processing accelerato da GPU per IBM watsonx.data si inserisce in un momento in cui analytics e AI stanno diventando più estese, più distribuite e più costose da gestire. Le aziende aumentano il volume dei dati analizzati, integrano workload AI nei processi decisionali e chiedono ai team data insight più rapidi, spesso senza poter aumentare in modo proporzionale budget, infrastrutture e risorse operative.

Il problema è che molti sistemi basati prevalentemente su CPU iniziano a mostrare limiti evidenti quando devono sostenere carichi analitici intensivi. Query complesse, grandi volumi di dati, join, aggregazioni e filtri possono rallentare i processi decisionali e generare un consumo infrastrutturale elevato. In questo scenario, la promessa dell’accelerazione GPU non è semplicemente fare le stesse cose più velocemente, ma cambiare l’economia di fondo delle analytics su scala enterprise.

IBM aveva già mostrato una prima indicazione di questo percorso in occasione di NVIDIA GTC, insieme a Nvidia e Nestlé, con una dimostrazione basata su architettura dati aperta e accelerazione GPU. In quel contesto erano stati mostrati workload analitici fino a 5 volte più veloci e una riduzione dei costi fino all’83%. Ora IBM porta quel lavoro dentro una fase più strutturata, annunciando la private technical preview per watsonx.data.

Prestazioni più alte e costi più bassi: per watsonx.data il punto non è solo la velocità

I primi risultati comunicati da IBM indicano che l’accelerazione GPU può produrre miglioramenti significativi nei workload analitici. La società cita anche l’esperienza interna della propria organizzazione CIO, utilizzata come Client Zero per validare l’innovazione in condizioni operative reali prima dell’apertura ai clienti.

Nei primi deployment interni, l’esecuzione di IBM watsonx.data Presto C++ con accelerazione GPU ha permesso ai team IBM di ottenere query fino a 25 volte più veloci rispetto all’esecuzione solo CPU, con una riduzione dei costi di circa l’80% per quel workload, grazie al minor tempo di esecuzione. I test sono stati condotti su workload di query telemetry usando infrastruttura Nvidia A100 GPU, con risultati che possono variare in base a tipo di query, volume dei dati, infrastruttura, configurazione e condizioni operative.

Il dato va letto correttamente. Non significa che ogni workload enterprise otterrà automaticamente gli stessi risultati. Significa però che, in determinati scenari data-intensive, il passaggio a un’elaborazione accelerata da GPU può incidere contemporaneamente su due variabili che spesso vengono considerate in tensione: performance e costo.

Per molte aziende questo è il punto più interessante. Se una query viene eseguita più rapidamente, il valore non è solo il tempo risparmiato dall’utente. Si riduce anche il consumo di risorse, migliora la capacità di gestire più richieste concorrenti e si abbassa il costo unitario dell’analisi. In ambienti dove AI e analytics crescono rapidamente, questa differenza può diventare strutturale.

Come cambia l’economia delle query con l’accelerazione GPU

Il principio tecnico alla base dell’innovazione è relativamente chiaro: spostare operazioni computazionalmente intensive, come join, aggregazioni e filtering, dalle CPU alle GPU. Le GPU sono progettate per elaborare molte operazioni in parallelo e possono quindi risultare particolarmente adatte a workload analitici che richiedono grandi volumi di calcolo ripetitivo su dataset estesi.

Per watsonx.data, questo significa poter eseguire query analitiche in modo molto più rapido rispetto agli approcci tradizionali, sfruttando l’elaborazione parallela massiva. Il beneficio non riguarda solo la riduzione della latenza. Una maggiore efficienza computazionale può ridurre l’uso complessivo dell’infrastruttura e contribuire a contenere il costo per query.

È qui che IBM prova a ridefinire il posizionamento dell’accelerazione GPU. Non come opzione specialistica riservata a pochi workload AI avanzati, ma come componente utile anche per analytics enterprise su larga scala. Le aziende che stanno portando l’AI dentro processi più ampi hanno infatti bisogno di interrogare, preparare, filtrare e aggregare dati con continuità. Se questi passaggi restano lenti o troppo costosi, l’intera catena AI ne risente.

La logica è semplice: insight più veloci significano decisioni più rapide; minori requisiti computazionali significano costi inferiori; un utilizzo più efficiente delle risorse consente di scalare analytics e AI senza una crescita lineare della spesa infrastrutturale.

Nessuna riscrittura delle query e nessuna migrazione forzata dei dati

Uno degli elementi più rilevanti dell’annuncio riguarda la trasparenza dell’accelerazione GPU per gli utenti. IBM sottolinea che le query esistenti, i formati dati e i connettori già in uso continuano a funzionare senza modifiche. Questo punto è decisivo perché molte iniziative di modernizzazione analytics si bloccano proprio sulla complessità del cambiamento.

In ambito enterprise, chiedere ai team di riscrivere SQL, migrare grandi quantità di dati o riprogettare pipeline analitiche significa introdurre costi, rischi e tempi difficili da giustificare. Le organizzazioni vogliono innovare, ma non possono permettersi di destabilizzare workflow critici o interrompere processi già consolidati.

Con l’accelerazione GPU per watsonx.data, IBM propone invece un modello meno invasivo. L’obiettivo è offrire query più veloci, maggiore concorrenza e latenza più bassa senza cambiare il modo in cui gli utenti accedono ai dati e lavorano con gli strumenti esistenti.

Questo rende la private technical preview particolarmente interessante per aziende che hanno già ambienti analitici complessi e non vogliono legarsi a un percorso di migrazione pesante. Il valore sta nella possibilità di migliorare il rapporto prezzo-prestazioni preservando continuità operativa.

Architettura aperta, Presto e ambienti ibridi

IBM inserisce questa innovazione nel quadro più ampio di watsonx.data, la piattaforma dati pensata per supportare analytics e AI su architetture aperte e ambienti ibridi. Il supporto alla compatibilità con Presto è un tassello importante, perché consente di mantenere coerenza con un ecosistema già adottato in molte organizzazioni per interrogare dati distribuiti.

La soluzione è progettata per funzionare in ambienti cloud e on-premises, mantenendo governance enterprise e compatibilità open source. Questa impostazione risponde a una realtà concreta: i dati aziendali non risiedono in un unico punto e i workload analitici devono spesso attraversare data lake, warehouse, sistemi transazionali, ambienti cloud e infrastrutture locali.

L’accelerazione GPU, in questo contesto, non viene proposta come una scorciatoia isolata, ma come un miglioramento integrato in un’architettura dati più ampia. Per le imprese che devono gestire AI e analytics su dataset distribuiti, la possibilità di accelerare le query senza rinunciare a governance e apertura tecnologica è un elemento differenziante.

Il riferimento a Presto C++ è rilevante anche sul piano prestazionale. IBM punta a combinare la flessibilità dell’accesso distribuito ai dati con un motore capace di sfruttare meglio acceleratori hardware, riducendo il divario tra architettura aperta e performance enterprise.

Perché l’accelerazione GPU diventa strategica per l’AI enterprise

L’AI su scala aziendale non vive solo nel momento dell’inferenza o del training. Prima che un modello possa generare valore, servono dati preparati, interrogabili, aggiornati e governati. Analytics e AI sono quindi sempre più intrecciate: la qualità e la velocità dell’analisi incidono sulla capacità di costruire casi d’uso AI credibili.

Quando i workload crescono, il costo dell’analisi può diventare un vincolo. Query lente rallentano i team, ritardano le decisioni e aumentano il consumo infrastrutturale. In parallelo, l’espansione dell’AI tende ad aumentare la domanda di elaborazione sui dati, perché più applicazioni, agenti e modelli hanno bisogno di accedere a contesto, storico, segnali operativi e informazioni aggiornate.

L’accelerazione GPU per watsonx.data risponde a questa pressione. Se i risultati osservati nei primi test saranno replicabili su una gamma ampia di workload, il beneficio potrebbe essere rilevante non solo per le prestazioni, ma anche per la sostenibilità economica dei programmi AI.

Il messaggio di IBM è che performance ed efficienza non devono essere necessariamente alternative. In alcuni scenari, spostare il calcolo sulle GPU può permettere di ottenere entrambe: query più rapide e costi inferiori.

La private technical preview apre il confronto con i clienti

IBM sta ampliando l’accesso alla nuova capacità attraverso un programma di private technical preview. L’obiettivo è coinvolgere clienti selezionati che gestiscono analytics su larga scala, workload AI-driven o iniziative di ottimizzazione del rapporto prezzo-prestazioni.

Per le aziende partecipanti, la private preview rappresenta la possibilità di collaborare direttamente con i team prodotto e ingegneria di IBM, testare la tecnologia su scenari concreti e contribuire all’evoluzione della roadmap. Per IBM, è un passaggio necessario per validare l’accelerazione GPU fuori dai contesti dimostrativi e interni, raccogliendo feedback su workload reali, architetture esistenti e requisiti enterprise.

È una fase importante perché l’accelerazione GPU nei sistemi dati deve dimostrare non solo picchi prestazionali, ma anche affidabilità, prevedibilità, gestione della concorrenza, integrazione con governance e compatibilità con le modalità operative dei clienti.

La sfida sarà trasformare risultati molto promettenti in una capacità stabile, generalizzabile e gestibile su larga scala. In altre parole, portare la logica dell’accelerazione GPU dall’ambito delle dimostrazioni tecniche a quello delle analytics quotidiane.

watsonx.data prova a ridurre il costo della scala

L’annuncio della private technical preview di GPU-accelerated query processing per IBM watsonx.data va letto dentro un tema più ampio: il costo della scala nell’AI enterprise. Più le aziende estendono analytics, automazione e intelligenza artificiale, più cresce la pressione sulle infrastrutture dati. Continuare ad aggiungere capacità CPU in modo lineare non è sempre sostenibile.

IBM propone una strada diversa: usare l’accelerazione GPU per rendere più efficiente l’elaborazione analitica, riducendo tempi e costi senza imporre discontinuità operative. È una proposta pragmatica, perché affronta un problema molto concreto per CIO, CDO e team data: ottenere più capacità dai propri ambienti senza trasformare ogni progetto in una migrazione o in una riscrittura.

Il valore potenziale è evidente soprattutto per organizzazioni con grandi volumi di query, dataset distribuiti, workload AI in crescita e necessità di mantenere governance su ambienti ibridi. In questi contesti, anche un miglioramento incrementale può avere impatti economici rilevanti; i risultati comunicati da IBM, se confermati su scala più ampia, indicherebbero un salto molto più marcato.

Con questa iniziativa, IBM cerca di posizionare watsonx.data come piattaforma dati capace di sostenere l’AI non solo sul piano funzionale, ma anche su quello economico. Perché l’AI enterprise non deve solo funzionare. Deve poter scalare senza rendere ingestibili i costi.

IBM Think 2026, IBM Sovereign Core porta la sovranità digitale nell’era dell’AI

IBM Think 2026, Db2 Genius Hub evolve con AI agentica e inferenza on-prem

IBM Think 2026, IBM e AWS portano l’agentic AI su scala enterprise

IBM Think 2026, IBM Cyber Fraud porta l’AI nelle indagini antifrode

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato sulle novità tecnologiche

iscriviti alla newsletter

IBM Think 2026, watsonx.data accelera analytics e AI con le GPU

IBM Think 2026, watsonx.data porta l’accelerazione GPU nelle analytics enterprise

Prestazioni più alte e costi più bassi: per watsonx.data il punto non è solo la velocità

Come cambia l’economia delle query con l’accelerazione GPU

Nessuna riscrittura delle query e nessuna migrazione forzata dei dati

Architettura aperta, Presto e ambienti ibridi

Perché l’accelerazione GPU diventa strategica per l’AI enterprise

La private technical preview apre il confronto con i clienti

watsonx.data prova a ridurre il costo della scala

LASCIA UN COMMENTO Cancella la risposta

Intelligenza artificiale

L’UE mette 10 miliardi sulle AI Gigafactories: fino a sette centri di calcolo, anche...

Qwen3.8-Max ha 2.400 miliardi di parametri e diventerà open weight

Il modello Astra di OpenAI ottiene dieci avanzamenti in matematica e informatica teorica

Trend

AI Gateway: perché le piattaforme AI hanno bisogno di un nuovo livello di controllo

Google DeepMind: il Nobel Demis Hassabis propone un organismo per valutare i modelli AI...

Forward Deployed Engineering, perché le big tech mandano gli ingegneri dentro le aziende