NVIDIA Vera Rubin entra in produzione per le AI factory agentiche

NVIDIA Vera Rubin ai factory

NVIDIA accelera sulla prossima generazione di AI factory con Vera Rubin, la piattaforma che entra nella fase di piena produzione e che punta a sostenere la crescita dei carichi di lavoro agentici su scala globale. Il messaggio è diretto: l’intelligenza artificiale agentica richiede un’infrastruttura diversa, capace di gestire processi più lunghi, più articolati e più distribuiti rispetto ai workload AI tradizionali.

La piattaforma Vera Rubin nasce per alimentare laboratori AI, cloud provider e hyperscaler impegnati nella costruzione delle nuove fabbriche dell’intelligenza. A produrre sistemi basati su Vera Rubin saranno i principali server maker taiwanesi e i leader globali della supply chain, con un ecosistema già esteso su centinaia di fabbriche e decine di Paesi.

NVIDIA Vera Rubin porta le AI factory agentiche alla scala POD

Il cuore dell’annuncio è la trasformazione dell’AI factory in una piattaforma POD-scale, cioè in un’infrastruttura pensata per operare come un unico grande supercomputer AI. Vera Rubin combina cinque rack progettati per funzionare insieme, integrando sistemi NVIDIA Vera Rubin NVL72, CPU NVIDIA Vera, NVIDIA Rubin GPU, BlueField-4 per storage e networking, e rack Ethernet NVIDIA Spectrum-6 SPX.

Il risultato dichiarato è un aumento di 10 volte del throughput per agenti su scala rispetto alla precedente generazione NVIDIA Grace Blackwell. È un dato che va letto nel contesto dell’AI agentica: qui non si tratta soltanto di generare una risposta, ma di gestire catene operative complesse, con ragionamento, recupero di informazioni, uso di strumenti, memoria di contesto e generazione finale.

Jensen Huang
Jensen Huang

Jensen Huang, fondatore e CEO di NVIDIA, descrive così il cambio di scenario: “L’AI agentica è un nuovo tipo di carico di lavoro. Un solo prompt può avviare un percorso di mille passaggi fatto di ragionamento, recupero di informazioni, uso di strumenti e generazione della risposta. Vera Rubin è stata costruita per questo momento: un motore per AI factory che offre intelligenza su larga scala, con le prestazioni, l’efficienza e la sicurezza necessarie ad alimentare la prossima rivoluzione industriale.”

Vera Rubin accelera la produzione con l’ecosistema MGX

Vera Rubin rappresenta la terza generazione dei sistemi rack-scale NVIDIA MGX. La scelta di basarsi su un design MGX open source già collaudato serve a rendere più rapida la produzione su larga scala, coinvolgendo centinaia di partner della supply chain NVIDIA. Solo a Taiwan sono coinvolti 150 partner, all’interno di una rete che si estende su oltre 350 fabbriche in 30 Paesi.

La produzione su larga scala comprende system builder, partner software infrastrutturali e specialisti dello storage. Tra i nomi coinvolti figurano Dell Technologies, HPE, Lenovo, Supermicro, AIC, Aivres, ASRock Rack, ASUS, Cloudian, Compal, DDN, Everpure, Foxconn, GIGABYTE, Hitachi Vantara, Hyve Solutions, IBM, Inventec, MinIO, MiTAC Computing, MSI, NetApp, Nutanix, Pegatron, Quanta Cloud Technology, VAST Data, WEKA, Wistron e Wiwynn.

La dimensione dell’ecosistema è un punto decisivo. NVIDIA non sta semplicemente introducendo una nuova generazione hardware, ma sta preparando una filiera capace di trasformare Vera Rubin in una piattaforma industriale disponibile per AI lab, cloud provider e hyperscaler. In un mercato in cui il time-to-capacity è sempre più critico, la capacità di far arrivare rapidamente infrastruttura AI pronta alla produzione diventa parte integrante del valore tecnologico.

Spectrum-X Ethernet Photonics prepara le AI factory da milioni di GPU

Uno degli elementi più rilevanti dell’annuncio riguarda la rete. Per supportare distribuzioni AI factory scale-out e scale-across, Vera Rubin introduce NVIDIA Spectrum-X Ethernet Photonics, una tecnologia di switching basata su co-packaged optics con SerDes da 200 Gb/s, ora in produzione.

Secondo NVIDIA, Spectrum-X Ethernet Photonics offre un’efficienza energetica 5 volte superiore, un uptime AI 5 volte migliore e un tempo di deployment 1,3 volte più rapido rispetto alle reti basate su transceiver tradizionali. Il nodo è tecnico ma molto concreto: nelle AI factory di nuova generazione, il networking non è più un livello accessorio, ma la struttura portante che permette a cluster enormi di GPU di funzionare come un sistema coerente.

La co-packaged optics consente di semplificare il design e liberare più potenza per il calcolo. Questo rende la rete una componente abilitante per AI factory da milioni di GPU. Tra i primi partner e adottanti dell’ecosistema vengono indicati CoreWeave, Lambda e Oracle Cloud Infrastructure.

Vera Rubin integra anche le DPU NVIDIA BlueField-4, con networking software-defined fino a 800 Gb/s e isolamento multi-tenant integrato. Con BlueField-4 Advanced Secure Trusted Resource Architecture, l’obiettivo è semplificare le operazioni di rete, migliorare l’isolamento dei tenant e aumentare il controllo sui cluster AI di dimensioni estreme.

La sicurezza diventa parte nativa dell’infrastruttura AI

L’espansione delle AI factory porta con sé una questione strutturale: la sicurezza dei dati, dei modelli e degli agenti. I workload agentici lavorano sempre più spesso su dati proprietari, contenuti regolati e modelli mission-critical, spesso in ambienti condivisi o cloud in cui l’infrastruttura non può essere considerata automaticamente affidabile.

Per rispondere a questo scenario, Vera Rubin è stata progettata con NVIDIA Confidential Computing full-stack, pensato per creare un ambiente di esecuzione affidabile a scala rack. La piattaforma Vera Rubin NVL72 combina CPU Vera, GPU Rubin, networking NVIDIA NVLink e funzionalità di sicurezza in un sistema unificato, con cifratura dei dati attraverso interconnessioni ad alta velocità e attestazione hardware per verificare l’integrità del sistema.

L’adozione di NVIDIA Confidential Computing coinvolge cloud provider come CoreWeave, Firmus, GMI Cloud, IBM Cloud, IREN, Lambda, Microsoft Azure, Nebius, Nscale, SpaceXAI e Vultr. La protezione a scala POD richiede però anche un livello software programmabile capace di applicare, orchestrare e adattare policy di sicurezza lungo l’intero sistema.

Qui entra in gioco NVIDIA DOCA, piattaforma software che porta funzioni avanzate di sicurezza su ogni rack Vera Rubin e su ogni livello della AI factory. DOCA protegge dati, agenti, memoria di contesto e inferenza AI con capacità applicate direttamente nel silicio BlueField-4. Tra le funzioni previste ci sono isolamento di rete multi-tenant, policy zero trust, rilevamento delle minacce in runtime e cifratura end-to-end fino a 800 Gb/s, senza gravare sulle CPU host.

DSX diventa la base operativa per le AI factory Vera Rubin

Vera Rubin si collega direttamente alla piattaforma NVIDIA DSX, che fornisce la base progettuale e operativa per costruire e gestire AI factory ottimizzate. DSX unifica reference design, simulazione, software infrastrutturale, impianti fisici e tecnologie dell’ecosistema, con l’obiettivo di ridurre il costo dei token e accelerare la messa in produzione.

Nel caso di Vera Rubin, DSX è costruita intorno all’architettura POD della piattaforma. L’obiettivo è allineare ogni livello dello stack, dal silicio ai sistemi, dal lifecycle management alle operazioni multi-tenant, migliorando velocità di deployment, affidabilità e resilienza.

Dell Technologies, HPE, Lenovo e Supermicro, insieme ad ASUS, Foxconn, GIGABYTE, Pegatron, Quanta Cloud Technology, Wistron e Wiwynn, stanno adottando NVIDIA DSX per accelerare il ramp delle AI factory basate su Vera Rubin. Il collegamento tra DSX e Vera Rubin conferma la strategia di NVIDIA: non vendere solo componenti, ma definire un modello operativo integrato per l’intera infrastruttura AI.

Vera Rubin segna il passaggio dall’accelerazione AI alla produzione industriale di intelligenza

La disponibilità commerciale è fissata per l’autunno, con l’avvio delle spedizioni di produzione. Il posizionamento è chiaro: Vera Rubin non è soltanto la prossima generazione della piattaforma NVIDIA per il calcolo accelerato, ma il motore infrastrutturale con cui alimentare le AI factory agentiche.

Il cambio di passo riguarda soprattutto la natura dei workload. L’AI agentica sposta il carico dall’elaborazione puntuale alla gestione di processi autonomi e lunghi, nei quali un sistema può orchestrare molteplici azioni, consultare fonti, usare strumenti, mantenere contesto e produrre risultati più articolati. Questo richiede più throughput, più rete, più sicurezza, più efficienza energetica e una gestione operativa di livello industriale.

Con Vera Rubin, NVIDIA prova a rispondere a tutti questi vincoli insieme. La piattaforma mette in relazione hardware rack-scale, networking fotonico, DPU, confidential computing, software di sicurezza, DSX e una supply chain globale già orientata alla produzione. È una strategia coerente con la traiettoria delle AI factory: meno data center generalisti, più impianti specializzati per produrre intelligenza artificiale in modo continuo, scalabile e sicuro.

NVIDIA DSX, il playbook per costruire e gestire le AI factory

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato sulle novità tecnologiche

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome