NVIDIA STX ridefinisce lo storage per le AI factory

nvidia storage

L’infrastruttura dei data center sta entrando in una nuova fase: quella in cui lo storage diventa un elemento critico per l’esecuzione dell’intelligenza artificiale. Con l’annuncio di BlueField-4 STX, NVIDIA introduce una nuova architettura di riferimento progettata per supportare sistemi di AI agentica e modelli capaci di lavorare su contesti molto ampi, riducendo i colli di bottiglia che oggi limitano le prestazioni dei sistemi basati su GPU.

La nuova architettura punta a ridefinire il ruolo dello storage all’interno delle cosiddette AI factory, rendendolo un componente attivo dell’elaborazione dei dati e non più un semplice livello di archiviazione. Secondo l’azienda, l’obiettivo è mantenere i dati il più possibile vicini alla capacità di calcolo delle GPU, così da accelerare inferenza, training e analytics.

NVIDIA BlueField-4 STX: una nuova architettura per lo storage dell’AI

La piattaforma NVIDIA BlueField-4 STX è stata progettata come architettura modulare di riferimento destinata a provider cloud, hyperscaler e imprese che devono gestire carichi di lavoro di intelligenza artificiale sempre più complessi. L’architettura consente di costruire infrastrutture di storage accelerate in grado di supportare i requisiti di contesto e memoria tipici dei sistemi di AI agentica.

Nei data center tradizionali lo storage è progettato principalmente per capacità e affidabilità. Tuttavia, quando si tratta di applicazioni AI che devono accedere a grandi volumi di dati in tempo reale, questi sistemi mostrano limiti evidenti in termini di latenza e throughput. Con STX, NVIDIA punta a superare queste limitazioni introducendo un’architettura che integra in modo più stretto rete, calcolo e storage.

La prima implementazione su scala rack della nuova architettura include la piattaforma NVIDIA CMX, un sistema di context memory storage che estende la memoria delle GPU con un livello ad alte prestazioni dedicato alla gestione del contesto. Questo consente ai sistemi di inferenza di lavorare con contesti molto più ampi mantenendo prestazioni elevate.

Prestazioni e efficienza energetica per le AI factory

Uno degli aspetti centrali della nuova architettura riguarda le prestazioni. NVIDIA indica che STX può offrire fino a cinque volte più token al secondo rispetto agli approcci tradizionali basati su storage convenzionale. Parallelamente, il sistema permette di raddoppiare la velocità di ingestione dei dati e di migliorare l’efficienza energetica fino a quattro volte rispetto alle architetture CPU utilizzate oggi per lo storage ad alte prestazioni. 

Alla base della piattaforma c’è un processore NVIDIA BlueField-4 ottimizzato per lo storage, che integra la CPU Vera di nuova generazione e la scheda di rete ConnectX-9 SuperNIC, insieme alla rete Ethernet Spectrum-X e allo stack software NVIDIA DOCA e AI Enterprise. L’obiettivo è creare un’infrastruttura completamente ottimizzata per i flussi di dati richiesti dai sistemi AI.

In questo contesto lo storage non è più un livello passivo, ma diventa parte integrante della pipeline di elaborazione dei modelli. L’architettura è pensata per mantenere un’elevata utilizzazione delle GPU, evitando che la mancanza di accesso rapido ai dati rallenti i processi di inferenza.

Ecosistema industriale e primi adottanti

La nuova architettura STX nasce già con un ampio ecosistema industriale. Diversi fornitori di storage stanno collaborando alla progettazione di infrastrutture di nuova generazione basate su questo modello.

Tra i partner coinvolti figurano aziende come Cloudian, DDN, Dell Technologies, Hitachi Vantara, HPE, IBM, MinIO, NetApp, Nutanix, VAST Data e WEKA, mentre i sistemi hardware basati su STX saranno realizzati anche da produttori come AIC, Supermicro e Quanta Cloud Technology.

Parallelamente, alcuni laboratori AI e cloud provider hanno già annunciato l’intenzione di utilizzare la nuova architettura per i sistemi di context memory storage. Tra questi compaiono CoreWeave, Crusoe, IREN, Lambda, Mistral AI, Nebius, Oracle Cloud Infrastructure e Vultr.

L’infrastruttura per l’era dell’AI agentica

Secondo NVIDIA, l’evoluzione verso sistemi AI agentici — capaci di operare su più passaggi, strumenti e sessioni — richiede una trasformazione radicale dell’infrastruttura dei data center.

Come ha spiegato il fondatore e CEO Jensen Huang, “l’AI agentica sta ridefinendo ciò che il software può fare — e l’infrastruttura di calcolo che la supporta deve essere reinventata per stare al passo. I sistemi AI che ragionano su contesti enormi e apprendono continuamente richiedono una nuova classe di storage.”

In questo scenario lo storage diventa quindi una componente strategica per sostenere modelli sempre più grandi e applicazioni AI distribuite. Con STX, NVIDIA punta a offrire una base modulare per costruire infrastrutture AI-native capaci di mantenere elevate prestazioni anche con volumi di dati e contesto in costante crescita.

Le prime piattaforme basate su questa architettura sono attese sul mercato nella seconda metà dell’anno, attraverso i partner dell’ecosistema hardware e storage.

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato sulle novità tecnologiche

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome