IBM e Groq hanno annunciato una partnership tecnologica e commerciale destinata a ridefinire la velocità e l’efficienza dell’intelligenza artificiale nelle imprese. L’accordo prevede l’integrazione della tecnologia di inferenza ad alte prestazioni di Groq, GroqCloud, all’interno di watsonx Orchestrate, offrendo ai clienti di IBM capacità di AI agentica con latenze estremamente ridotte e costi ottimizzati.
La collaborazione include inoltre un piano per integrare e migliorare la tecnologia open source vLLM di Red Hat con l’architettura LPU di Groq, nonché il supporto dei modelli IBM Granite su GroqCloud. L’obiettivo è fornire alle aziende l’infrastruttura necessaria per scalare i propri agenti AI, riducendo gli ostacoli legati a velocità, costi e affidabilità.
Secondo IBM, le sfide più grandi per le imprese che vogliono portare l’AI dalla fase pilota alla produzione riguardano proprio la capacità di eseguire workflow complessi in modo stabile e scalabile, soprattutto nei settori regolamentati come sanità, finanza e pubblica amministrazione. L’unione tra la velocità e l’efficienza di Groq e le capacità di orchestrazione agentica di IBM offre una risposta concreta a queste esigenze.
“Molte grandi organizzazioni hanno diverse opzioni di inferenza durante la sperimentazione, ma quando passano alla produzione devono garantire che i workflow complessi vengano eseguiti con successo per offrire esperienze di qualità,” ha spiegato Rob Thomas, SVP Software e Chief Commercial Officer di IBM. “La nostra partnership con Groq sottolinea l’impegno di IBM nel fornire ai clienti le tecnologie più avanzate per la distribuzione dell’AI e la creazione di valore.”
GroqCloud, basata su architettura LPU proprietaria, offre prestazioni fino a cinque volte superiori e più convenienti rispetto ai sistemi GPU tradizionali, garantendo bassa latenza e prestazioni costanti anche su scala globale. Questa efficienza si traduce in vantaggi tangibili per gli agenti AI, che possono operare in tempo reale in contesti critici come l’assistenza sanitaria, dove IBM supporta già clienti che gestiscono migliaia di richieste simultanee dei pazienti.
“Con la velocità di Groq e l’esperienza enterprise di IBM, stiamo rendendo l’AI agentica una realtà per il business,” ha commentato Jonathan Ross, CEO e fondatore di Groq. “Insieme permettiamo alle organizzazioni di sbloccare il pieno potenziale dell’AI, passando dalla sperimentazione all’adozione diffusa con fiducia.”
La collaborazione si concentra su tre aree principali:
l’inferenza ad alta velocità per potenziare casi d’uso come customer care e supporto ai dipendenti; l’implementazione sicura e conforme alle normative per i settori regolamentati; e la piena integrazione con watsonx Orchestrate per adottare modelli agentici personalizzati.
IBM e Groq lavoreranno inoltre per rendere watsonx capace di sfruttare l’accelerazione hardware di GroqCloud mantenendo la compatibilità con gli strumenti di sviluppo più diffusi, semplificando l’orchestrazione dell’inferenza e il bilanciamento del carico.
La visione condivisa è quella di un’AI enterprise più veloce, intelligente e concretamente applicabile, capace di sostenere il passaggio dall’idea alla produzione e di aprire una nuova fase di automazione agentica nel business.






