Arm debutta nel silicio con AGI CPU, il primo processore per data center AI agentici

Arm ha annunciato Arm AGI CPU, un nuovo processore basato sulla piattaforma Neoverse progettato per le infrastrutture di intelligenza artificiale.

Per la prima volta nella sua storia, l’azienda introduce un chip sviluppato direttamente, superando il modello tradizionale basato su IP, cioè i progetti di CPU concessi in licenza ad altri produttori, e Compute Subsystems.

L’obiettivo è offrire maggiore flessibilità ai clienti nella distribuzione della tecnologia Arm, consentendo sia lo sviluppo di silicio custom sia l’adozione di soluzioni progettate direttamente dall’azienda. La nuova fase della piattaforma Arm nasce per rispondere alla crescita dei carichi AI e alla necessità di implementazioni più rapide su larga scala.

La CPU al centro dei sistemi AI distribuiti

La diffusione di sistemi AI in grado di operare in modo continuo, coordinando attività tra modelli e gestendo processi autonomi, aumenta il volume di operazioni e di dati elaborati. In particolare, cresce il numero di token generati, con un impatto diretto sulla necessità di capacità computazionale per attività di reasoning, coordinamento e movimentazione dei dati.

Secondo Arm, i data center AI potrebbero arrivare a richiedere oltre quattro volte la capacità CPU per gigawatt rispetto ai livelli attuali. In questo contesto, la CPU è responsabile della gestione complessiva dell’infrastruttura: orchestrazione degli acceleratori, controllo del piano di gestione, scheduling dei workload e trasferimento dei dati tra sistemi.

Architettura Neoverse V3 e specifiche del processore

L’Arm AGI CPU utilizza core Arm Neoverse V3, evoluzione della linea Neoverse destinata a data center e sistemi ad alte prestazioni,  e può integrare fino a 136 core per processore. Il design è ottimizzato per carichi paralleli e persistenti, con particolare attenzione alla stabilità delle prestazioni sotto utilizzo continuativo.

Rispetto alle generazioni precedenti, Neoverse V3 è progettata per offrire maggiore throughput per thread, migliore gestione della memoria e supporto a carichi fortemente paralleli. L’architettura è inoltre pensata per integrarsi con acceleratori e interconnessioni ad alta velocità, elementi chiave nelle infrastrutture AI moderne.

La piattaforma offre una banda di memoria fino a 6 GB/s per core con latenza inferiore a 100 nanosecondi, e un TDP di 300 watt. L’architettura prevede un core dedicato per ogni thread di esecuzione, con l’obiettivo di garantire prestazioni deterministiche ed evitare fenomeni di throttling o inattività dei core.

Densità: fino a oltre 45.000 core per rack

Arm ha definito una configurazione di riferimento basata su un server 1OU dual-node, con due processori per blade e un totale di 272 core per unità.

In un rack standard raffreddato ad aria da 36 kW è possibile installare fino a 30 blade, per un totale di 8.160 core. In collaborazione con Supermicro è stata inoltre sviluppata una configurazione a raffreddamento liquido da 200 kW, in grado di ospitare 336 CPU e oltre 45.000 core per rack.

Il design supporta quindi implementazioni ad alta densità, mantenendo l’operatività entro i limiti energetici dei data center.

Prestazioni e impatto sui costi

Secondo le stime fornite da Arm, una configurazione completa basata su AGI CPU può offrire oltre il doppio delle prestazioni per rack rispetto ai sistemi x86 di ultima generazione.

L’azienda indica inoltre un potenziale risparmio fino a 10 miliardi di dollari di CAPEX per gigawatt di capacità installata, legato alla maggiore efficienza e densità computazionale della piattaforma.

Meta guida lo sviluppo, ampia adesione dell’ecosistema

Meta è indicata come partner principale e co-sviluppatore, con l’obiettivo di ottimizzare infrastrutture su larga scala e integrare il processore con i propri acceleratori MTIA.

Tra gli altri partner figurano Cerebras, Cloudflare, F5, OpenAI, Positron, Rebellions, SAP e SK Telecom, impegnati nell’adozione della piattaforma per casi d’uso che includono gestione degli acceleratori, elaborazione del control plane e hosting di applicazioni e servizi AI in ambito cloud ed enterprise.

Arm collabora inoltre con OEM e ODM tra cui ASRock Rack, Lenovo, Quanta Computer e Supermicro. I primi sistemi sono già disponibili, con una distribuzione più ampia prevista nella seconda metà dell’anno.

L’espansione della piattaforma è supportata da un ecosistema che include oltre 50 aziende tra hyperscaler, produttori di semiconduttori, fornitori di memoria e operatori cloud, tra cui AWS, Google, Microsoft, NVIDIA, Samsung, SK hynix e TSMC.

Server di riferimento e sviluppo su standard aperti

Per accelerare l’adozione, Arm ha annunciato un server di riferimento 1OU dual-node conforme allo standard Open Compute Project DC-MHS. L’azienda prevede di contribuire con firmware, specifiche architetturali e strumenti per il debug, la diagnostica e la verifica dei sistemi Arm-based.

Disponibilità e roadmap

L’Arm AGI CPU rappresenta il primo prodotto di una nuova linea di silicio per data center. Sono previsti ulteriori sviluppi orientati a prestazioni, scalabilità ed efficienza, in parallelo alla roadmap Neoverse CSS.

Il processore è disponibile per l’ordine, con sistemi già in distribuzione e ampliamento dell’offerta previsto nel corso dell’anno.

Le reazioni del mercato

Le prime reazioni del mercato e della stampa specializzata si concentrano sulla portata strategica dell’ingresso diretto di Arm nel silicio. Il progetto era atteso da tempo e segna un passaggio verso un ruolo più diretto nella realizzazione dell’infrastruttura AI, con un chip pensato per lavorare insieme ad altri componenti nei server ad alte prestazioni.

L’attenzione si concentra in particolare su efficienza energetica e performance per watt, indicati come fattori chiave per i data center di nuova generazione. Sul fronte finanziario, il contesto resta caratterizzato da valutazioni contrastanti: da un lato il potenziale legato alla crescita dell’AI nei data center, dall’altro elementi di cautela legati alla valutazione elevata del titolo e alla transizione verso modelli più integrati.

All’annuncio ha fatto seguito una serie di prese di posizione da parte dei principali attori della filiera tecnologica, che evidenziano il ruolo della nuova CPU nel contesto dell’infrastruttura AI.

Dal lato cloud, AWS sottolinea la continuità della collaborazione con Arm, ricordando come la famiglia Graviton abbia già rappresentato una parte significativa della capacità computazionale introdotta nel 2025, con vantaggi in termini di rapporto prezzo/prestazioni. Anche Google evidenzia il contributo dell’architettura Arm all’efficienza energetica e alla scalabilità dei workload cloud-native e AI, indicando nella nuova AGI CPU un possibile fattore abilitante per una nuova generazione di infrastrutture.

Microsoft si inserisce nello stesso solco, richiamando il ruolo dei processori Azure Cobalt basati su Neoverse e sottolineando come l’evoluzione della piattaforma Arm rafforzi l’ecosistema per i carichi AI e cloud. NVIDIA, che collabora con Arm da quasi due decenni, mette invece l’accento sulla capacità dell’architettura di adattarsi a tutte le fasi dell’AI, dal cloud all’edge fino ai cosiddetti “AI factory”.

Sul fronte dei semiconduttori e delle infrastrutture, Broadcom evidenzia come la piattaforma Arm abbia consentito di accelerare lo sviluppo di soluzioni XPU e networking per hyperscaler, mentre Marvell sottolinea il ruolo della nuova CPU nell’ampliare le opzioni disponibili per la progettazione di infrastrutture AI sempre più complesse.

Il tema dell’integrazione tra compute e memoria emerge nelle dichiarazioni di Micron e SK hynix, che collegano l’evoluzione dei sistemi AI alla necessità di architetture in grado di coordinare in modo più efficiente elaborazione, capacità e banda. Samsung richiama invece l’importanza della co-ottimizzazione tra logica, memoria e packaging avanzato per sostenere i carichi AI di nuova generazione.

Infine, TSMC evidenzia il ruolo della produzione avanzata, indicando nel processo a 3 nanometri un elemento chiave per ottenere miglioramenti in termini di prestazioni ed efficienza energetica e per supportare l’evoluzione dei data center AI.

Nel complesso, le dichiarazioni convergono nel descrivere l’AGI CPU come un elemento destinato a inserirsi in una filiera fortemente integrata, in cui progettazione del silicio, produzione, memoria, networking e piattaforme cloud concorrono alla costruzione delle infrastrutture AI di nuova generazione.

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato sulle novità tecnologiche

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome