NVIDIA Vera, la CPU per gli agenti AI e le nuove AI factory

1 Giugno 2026

NVIDIA porta l’AI agentica anche nel cuore della componente CPU con Vera, un nuovo processore progettato per sostenere carichi di lavoro che non si limitano più all’inferenza tradizionale, ma includono agenti autonomi, reinforcement learning, data processing, orchestrazione e uso di strumenti. La novità conferma una linea ormai chiara nella strategia dell’azienda: le AI factory non dipendono soltanto dalle GPU, ma da un’intera architettura capace di far avanzare ogni fase del ciclo di lavoro dell’intelligenza artificiale.

Vera entra in piena produzione e nasce come la prima CPU NVIDIA costruita specificamente per gli agenti AI. Secondo l’azienda, il processore consente un completamento delle attività 1,8 volte più rapido rispetto alle CPU x86, con l’obiettivo di aumentare throughput, efficienza e ricavi da token nei data center. Il tema non è secondario: se gli agenti AI diventeranno una delle forme dominanti di utilizzo del calcolo, anche la CPU dovrà essere ripensata in funzione di workload più dinamici, distribuiti e sensibili alla latenza.

NVIDIA Vera porta la CPU dentro l’era dell’AI agentica

Vera nasce sull’eredità delle CPU NVIDIA Grace, che hanno raggiunto quasi 2,5 milioni di unità distribuite, ma si colloca in una fase diversa del mercato. I sistemi AI stanno passando da modelli che rispondono a richieste relativamente circoscritte ad agenti capaci di agire, eseguire codice, usare strumenti, valutare risultati e iterare su processi complessi.

In questo scenario, la CPU non è più un componente di supporto generico. Diventa il motore che gestisce runtime Python, esecuzione di codice in sandbox, logiche di orchestrazione, pipeline analytics e attività di data processing che si trovano nel percorso critico delle AI factory. Se questi passaggi restano vincolati dalla CPU, anche gli acceleratori più potenti rischiano di non essere sfruttati pienamente.

Il fondatore e CEO di NVIDIA Jensen Huang

Jensen Huang, fondatore e CEO di NVIDIA, descrive così il ruolo della nuova piattaforma: “Gli agenti AI saranno i maggiori utilizzatori di computing. Vera è la prima CPU progettata per quel futuro, costruita per eseguire l’AI agentica su scala hyperscale con prestazioni, efficienza e programmabilità straordinarie.”

Vera punta su prestazioni, efficienza e token per dollaro

Il punto economico dell’annuncio è esplicito. Nelle AI factory, la metrica rilevante si sta spostando dai core per dollaro ai token per dollaro. Questo significa che la valutazione dell’infrastruttura non dipende più soltanto dalla potenza teorica o dal numero di core disponibili, ma dalla capacità di completare più rapidamente il lavoro necessario alla produzione di intelligenza artificiale.

Vera è basata su Olympus, un core CPU custom sviluppato da NVIDIA per gestire proprio questa transizione. Il processore integra 88 core Olympus, Spatial Multithreading e un sottosistema di memoria LPDDR5X con banda fino a 1,2 TB/s. L’obiettivo è elaborare più istruzioni, anticipare il comportamento delle applicazioni e spostare dati tra numerosi ambienti concorrenti, query e attività di data processing.

Il risultato atteso è una riduzione del tempo che gli agenti trascorrono in attesa di passaggi CPU-bound. È un dettaglio tecnico, ma con un impatto concreto: se un agente deve compilare codice, interrogare database, eseguire logiche Python, attivare strumenti o coordinare più passaggi prima di produrre una risposta, la CPU incide direttamente sull’interattività e sul throughput finale.

Secondo i benchmark citati da Phoronix, Vera ha ottenuto le migliori prestazioni complessive su workload agentici come compilazione di codice, Python, Java e database processing. Sono ambiti che rappresentano una parte rilevante del lavoro effettivo degli agenti, soprattutto quando operano in ambienti enterprise o cloud su processi articolati.

Dai server standalone ai sistemi Vera Rubin

Vera non è pensata soltanto come CPU autonoma, ma come elemento trasversale nell’intera AI factory. Può alimentare server standalone, sistemi NVIDIA Vera Rubin e piattaforme di storage AI Vera BlueField-4 STX. Questa flessibilità consente di usare la CPU sia per infrastrutture dedicate al data processing sia per sistemi accelerati fortemente integrati.

Nei sistemi Vera Rubin, Vera opera come host CPU attraverso la tecnologia NVIDIA NVLink-C2C di seconda generazione, che offre fino a 1,8 TB/s di banda coerente tra CPU e GPU. Questo collegamento è essenziale per ridurre le frizioni tra le diverse componenti del sistema e mantenere elevato il flusso di lavoro tra processore general purpose e acceleratori.

Vera contribuisce anche all’estensione di NVIDIA Confidential Computing a scala rack, con l’obiettivo di proteggere i workload agentici. È un aspetto coerente con l’evoluzione degli agenti AI in ambito enterprise, dove i sistemi devono accedere a dati sensibili, strumenti interni, codice e memoria di contesto senza trasformare l’infrastruttura in un punto debole.

La stessa CPU entra anche nel processore NVIDIA Vera BlueField-4 STX, dove viene combinata con networking ad alte prestazioni, accelerazione dello storage e sicurezza in-silicon. In questo caso, Vera diventa parte di piattaforme dati AI-native secure-by-design, pensate per ambienti in cui storage, rete e sicurezza devono funzionare alla velocità degli agenti autonomi.

AI lab, hyperscaler e imprese guardano alla nuova CPU NVIDIA

L’adozione prevista di Vera coinvolge alcuni dei nomi più rilevanti dell’ecosistema AI. Tra i clienti che stanno esplorando o pianificando l’uso della nuova CPU figurano NYSE, Anthropic, OpenAI, SpaceXAI, ByteDance, CoreWeave, Lambda, Nebius, Nscale e Oracle Cloud Infrastructure. Il posizionamento è ampio: AI lab, cloud provider, hyperscaler e infrastrutture finanziarie ad alte prestazioni.

NYSE punta a usare Vera in collaborazione con Redpanda e HPE per scalare la capacità e ottimizzare la latenza della propria infrastruttura di mercato, che elabora più di 1,1 trilioni di messaggi al giorno. Lynn Martin, presidente di NYSE Group, spiega: “Al NYSE, il nostro obiettivo è ottimizzare latenza, throughput e affidabilità dei sistemi alla base della nostra infrastruttura senza pari. Il NYSE elabora più di 1,1 trilioni di messaggi al giorno e, in collaborazione con Redpanda e HPE, usando CPU NVIDIA Vera, scaleremo la nostra capacità ottimizzando ulteriormente la latenza per alimentare un’infrastruttura di mercato ad alte prestazioni, resiliente e pronta per l’AI.”

Anthropic sta valutando Vera per scalare workload agentici ad alta intensità CPU. James Bradbury, head of compute di Anthropic, afferma: “Scalare il computing è un acceleratore importante per la crescita dei modelli. Siamo entusiasti di vedere Vera emergere come una parte promettente dell’ecosistema quando si tratta di risolvere i workload agentici.”

Oracle Cloud Infrastructure vede invece Vera come parte della prossima frontiera del supercomputing AI hyperscale. Mahesh Thiagarajan, executive vice president di Oracle Cloud Infrastructure, sottolinea: “Oracle Cloud Infrastructure sta scalando rapidamente l’infrastruttura AI per rispondere alla forte domanda di training, inferenza e AI agentica. Implementando le CPU NVIDIA Vera, OCI supporterà workload di reasoning ad alto throughput e data processing negli ambienti AI di nuova generazione.”

L’ecosistema hardware prepara sistemi Vera su larga scala

La disponibilità di Vera non dipenderà da una singola configurazione. NVIDIA prevede sistemi in rack densi con raffreddamento a liquido per ambienti agentic AI e reinforcement learning su larga scala, insieme a configurazioni flessibili a due socket raffreddate ad aria per enterprise, cloud, data processing e deployment di AI factory.

I principali produttori di sistemi coinvolti includono Aivres, ASRock Rack, ASUS, Compal, Dell, Foxconn, GIGABYTE, HPE, Hyve Solutions, Inventec, Lenovo, MiTAC Computing, MSI, Pegatron, Quanta Cloud Technology, Supermicro, Wistron e Wiwynn. Dell, HPE, Lenovo e Supermicro offriranno Vera anche in configurazioni server CPU standalone, presentate come prima opzione CPU standard alternativa oltre x86.

Sul fronte cloud, tra i service provider che pianificano il deployment di CPU Vera ci sono Akamai, ByteDance, Cloudflare, CoreWeave, Crusoe, Lambda, Nebius, Nscale, Oracle Cloud Infrastructure, Redpanda, Starburst, Together AI e Vultr. I sistemi Vera saranno disponibili da system builder e cloud partner a partire dall’autunno.

Vera conferma che l’AI agentica ridisegna tutta l’infrastruttura

Il significato industriale di Vera va oltre il lancio di una nuova CPU. NVIDIA sta cercando di dimostrare che l’AI agentica non può essere sostenuta solo aumentando la capacità GPU. Gli agenti generano workload più eterogenei: compilano codice, usano strumenti, interrogano database, processano dati, mantengono contesto e coordinano operazioni. Tutte queste attività richiedono CPU più efficienti e progettate per ridurre i tempi morti lungo la catena.

Con Vera, NVIDIA porta la propria logica full-stack anche nella CPU general purpose, ma la piega ai bisogni specifici delle AI factory. La promessa è aumentare il throughput end-to-end, migliorare la reattività degli agenti, ridurre i colli di bottiglia CPU-bound e aumentare la produttività dell’infrastruttura in termini di token per dollaro.

La direzione è coerente con Vera Rubin, BlueField-4 STX e DSX: costruire una piattaforma industriale per l’AI in cui CPU, GPU, networking, storage, sicurezza, software operativo ed ecosistema di partner funzionino come parti di un unico sistema. L’AI agentica, se crescerà come previsto, non richiederà solo modelli più capaci, ma infrastrutture progettate per reggere una nuova forma di lavoro computazionale continuo, distribuito e autonomo.