Con l’evoluzione dell’intelligenza artificiale verso modelli sempre più autonomi e capaci di ragionare, cambia anche il ruolo dell’infrastruttura che sostiene questi sistemi. In questo contesto NVIDIA presenta Vera, una nuova CPU progettata esplicitamente per supportare le esigenze dell’AI agentica e del reinforcement learning su larga scala, promettendo un salto significativo in termini di prestazioni ed efficienza energetica.
Secondo quanto annunciato dall’azienda, Vera è in grado di offrire un’efficienza fino a due volte superiore e prestazioni circa il 50% più veloci rispetto alle CPU tradizionali utilizzate nei data center per carichi di lavoro AI. L’obiettivo è sostenere la crescente domanda di infrastrutture in grado di gestire agenti intelligenti, sistemi di reasoning e servizi AI distribuiti su larga scala.
Vera CPU e la nuova infrastruttura per l’AI agentica
La nuova architettura si inserisce nel percorso iniziato con la piattaforma Grace e punta a costruire quello che NVIDIA definisce una vera e propria AI factory, ovvero infrastrutture progettate per generare, orchestrare e gestire servizi basati su agenti intelligenti.
Nel dettaglio, Vera integra 88 core personalizzati sviluppati da NVIDIA, denominati Olympus, progettati per garantire elevate prestazioni single-thread e una banda memoria particolarmente elevata. Ogni core è in grado di eseguire due attività simultaneamente attraverso la tecnologia di Spatial Multithreading, assicurando prestazioni costanti anche in ambienti multi-tenant dove numerosi carichi di lavoro AI operano contemporaneamente.
Un elemento chiave dell’architettura è anche il sottosistema di memoria basato su LPDDR5X, che raggiunge fino a 1,2 TB/s di banda, circa il doppio rispetto alle CPU general purpose e con un consumo energetico dimezzato. Questo consente di sostenere applicazioni che richiedono accesso rapido ai dati, come pipeline analitiche, orchestrazione di agenti AI e servizi cloud di nuova generazione.
Integrazione con GPU e infrastrutture AI su larga scala
Vera è progettata per lavorare in stretta integrazione con le GPU NVIDIA all’interno della piattaforma Rubin NVL72, collegandosi attraverso la tecnologia NVLink-C2C con una banda coerente di 1,8 TB/s, circa sette volte superiore rispetto a PCIe Gen 6. Questa architettura consente uno scambio dati estremamente rapido tra CPU e GPU, elemento fondamentale per accelerare training, inferenza e orchestrazione dei modelli AI.
Tra le configurazioni annunciate figura anche un rack dedicato che integra 256 CPU Vera raffreddate a liquido, capace di gestire oltre 22.500 ambienti CPU simultanei, ciascuno in esecuzione indipendente alla massima potenza. L’obiettivo è permettere ai data center di scalare rapidamente fino a decine di migliaia di istanze AI agentiche nello stesso sistema.
Ecosistema industriale e cloud già coinvolto
Il lancio di Vera arriva con il supporto di un ecosistema molto ampio. Tra gli hyperscaler che stanno collaborando per implementare la nuova CPU figurano Alibaba, ByteDance, Meta e Oracle Cloud Infrastructure, mentre tra i provider cloud e le piattaforme AI compaiono aziende come CoreWeave, Lambda, Nebius e Nscale.
Sul fronte hardware, diversi produttori di server e infrastrutture stanno già adottando la piattaforma, tra cui Dell Technologies, HPE, Lenovo e Supermicro, insieme a numerosi partner OEM globali. Questa diffusione mira a trasformare Vera in uno standard di riferimento per i carichi di lavoro AI nei data center.
Nuovi scenari per sviluppo software e supercalcolo
Oltre ai provider cloud, anche aziende software e centri di ricerca stanno sperimentando l’architettura Vera per applicazioni avanzate. Piattaforme di sviluppo AI-native e sistemi di streaming dati hanno già riportato miglioramenti significativi in termini di throughput e latenza.
Parallelamente, alcuni importanti centri di supercalcolo e laboratori nazionali stanno pianificando l’adozione della CPU per nuovi sistemi HPC, evidenziando il potenziale della piattaforma anche nel calcolo scientifico.
Disponibilità
NVIDIA ha annunciato che la CPU Vera è già in produzione e sarà disponibile attraverso i partner hardware nel secondo semestre dell’anno.






