Meta rafforza la propria strategia infrastrutturale sull’intelligenza artificiale stringendo un nuovo accordo con Amazon Web Services per l’adozione su larga scala dei processori Graviton. L’intesa segna un’evoluzione significativa nella collaborazione tra le due aziende e introduce un elemento chiave nella costruzione della prossima generazione di sistemi AI di Meta, sempre più orientati verso modelli “agentici”, capaci cioè di ragionare, pianificare ed eseguire compiti complessi in autonomia.

Il deployment iniziale prevede l’utilizzo di decine di milioni di core Graviton, con una scalabilità che potrà crescere in funzione dell’espansione delle capacità AI del gruppo. Si tratta di un ordine di grandezza che colloca Meta tra i principali utilizzatori globali della famiglia di chip progettata da AWS, consolidando una relazione tecnologica già estesa, che include l’uso su larga scala di Amazon Bedrock per i servizi di intelligenza artificiale.

Il cambio di paradigma: dall’AI generativa all’AI agentica

Il contesto in cui si inserisce l’accordo è quello di una trasformazione strutturale delle architetture AI. Se le GPU restano centrali nella fase di training dei modelli di grandi dimensioni, l’emergere dell’AI agentica sta spostando una parte rilevante del carico computazionale verso workload intensivi lato CPU.

Attività come il ragionamento in tempo reale, la generazione di codice, la ricerca semantica e l’orchestrazione di task multi-step richiedono infatti un’elevata capacità di elaborazione distribuita e continua, ambito in cui processori come Graviton5 risultano progettati in modo specifico.

All’interno di Meta, questi chip saranno impiegati per sostenere sistemi che devono gestire miliardi di interazioni, coordinando flussi operativi articolati e dinamici. La natura stessa dei modelli agentici implica infrastrutture capaci di eseguire sequenze complesse di operazioni in modo efficiente, con latenze ridotte e alta affidabilità.

ARM vs x86: perché cambia l’equilibrio nei data center AI

In questo scenario emerge con maggiore chiarezza anche il significato architetturale della scelta Graviton. I processori sviluppati da AWS sono basati su architettura ARM, quindi su un modello RISC che privilegia semplicità delle istruzioni, efficienza energetica e scalabilità orizzontale.

È un’impostazione diversa rispetto alle CPU x86 tradizionali, progettate per massimizzare le prestazioni per singolo core e vincolate a una maggiore complessità del set di istruzioni. Con Graviton5, AWS punta invece su un’elevata densità di core e su un’architettura ottimizzata per carichi altamente paralleli.

Questa differenza si riflette direttamente nella natura dei workload AI più recenti. Le pipeline agentiche non sono più sequenze lineari, ma sistemi distribuiti che eseguono contemporaneamente migliaia di operazioni: interrogazioni, chiamate a modelli, accesso a dati, generazione e verifica dei risultati.

In questo contesto, la capacità di orchestrare task multipli diventa più rilevante della pura potenza per thread, e l’architettura ARM offre un vantaggio strutturale in termini di densità computazionale ed efficienza per watt.

Graviton5, Nitro ed EFA: architettura, prestazioni e rete

Dal punto di vista tecnico, Graviton5 introduce un’architettura con 192 core e una cache fino a cinque volte più ampia rispetto alla generazione precedente. Questo consente di ridurre fino al 33% le latenze di comunicazione tra i core, migliorando la velocità di elaborazione dei dati e la banda disponibile.

L’infrastruttura su cui si innesta questo livello computazionale è il sistema AWS Nitro, uno degli elementi più critici dell’architettura cloud di Amazon. Nitro sposta funzioni tradizionalmente gestite dall’hypervisor – come virtualizzazione, networking e storage – su componenti hardware dedicati, riducendo l’overhead e migliorando l’isolamento tra workload.

Come osserva Nafea Bshara, vicepresidente e distinguished engineer di Amazon, “non si tratta solo di chip, ma di offrire ai clienti una base infrastrutturale completa, insieme a servizi di dati e inferenza, per costruire AI in grado di comprendere, anticipare e scalare in modo efficiente fino a miliardi di persone nel mondo”. In questo quadro, Nitro rappresenta il livello abilitante che consente di sfruttare pienamente il silicio proprietario.

La possibilità di accedere a istanze bare-metal, mantenendo al contempo compatibilità con componenti standard come Elastic Network Adapter ed Elastic Block Store, permette a Meta di eseguire ambienti altamente ottimizzati senza rinunciare alla flessibilità operativa del cloud. Il risultato è una riduzione del compromesso tra controllo diretto dell’hardware e astrazione tipica delle infrastrutture virtualizzate.

A questo si aggiunge il supporto per Elastic Fabric Adapter, progettato per abilitare comunicazioni a bassa latenza e alta banda tra istanze. È un elemento cruciale nelle pipeline AI distribuite, dove i carichi di lavoro vengono suddivisi tra più nodi che devono operare in modo coordinato.

Nel caso dei sistemi agentici, questo aspetto diventa ancora più rilevante. Le interazioni tra componenti – modelli, orchestratori, servizi esterni – generano un traffico continuo e altamente sensibile alla latenza, rendendo la rete parte integrante della performance complessiva.

Santosh Janardhan, responsabile infrastrutture di Meta, sottolinea che “con l’espansione su Graviton possiamo eseguire i workload CPU-intensive alla base dell’AI agentica con le prestazioni e l’efficienza richieste dalla nostra scala operativa”. Non è quindi solo la potenza del singolo chip a fare la differenza, ma la coerenza dell’intero stack, dal compute alla rete.

CPU come control plane delle pipeline AI

Il ruolo delle CPU all’interno delle pipeline AI risulta quindi ridefinito. Se le GPU continuano a essere il fulcro del training e delle operazioni matriciali più intensive, le CPU diventano sempre più il livello di orchestrazione, il “control plane” che governa l’esecuzione dei modelli.

Nei sistemi agentici questo livello è responsabile della pianificazione delle azioni, della gestione dei flussi logici e dell’interazione con servizi esterni, generando un volume di operazioni CPU-bound in costante crescita.

In questo equilibrio, architetture come Graviton permettono di sostenere la complessità operativa senza ricorrere in modo esclusivo a risorse più costose ed energivore.

Efficienza energetica e sostenibilità

Un ulteriore elemento chiave riguarda l’efficienza energetica. Graviton5 è realizzato con tecnologia a 3 nanometri, che consente di migliorare densità e consumi rispetto alle generazioni precedenti.

AWS, controllando l’intera filiera progettuale – dal design del chip all’architettura dei server – può ottimizzare in modo più spinto il rapporto tra prestazioni e consumo energetico rispetto a soluzioni standard di mercato. Il risultato è un incremento prestazionale fino al 25% accompagnato da un miglioramento dell’efficienza complessiva.

Un modello infrastrutturale destinato a consolidarsi

L’accordo riflette anche una scelta strategica di diversificazione delle risorse computazionali. “Diversificare le fonti di calcolo è un imperativo strategico mentre continuiamo a scalare l’infrastruttura alla base delle ambizioni AI di Meta”, osserva Santosh Janardhan. “AWS è da anni un partner cloud di fiducia, e l’espansione verso Graviton ci consente di gestire in modo efficiente i workload CPU-intensive legati all’AI agentica”.

Dal lato AWS, Nafea Bshara evidenzia che “la partnership con Meta, con il deployment di decine di milioni di core Graviton, dimostra cosa accade quando si combinano silicio progettato ad hoc e l’intero stack AI di AWS per alimentare la nuova generazione di intelligenza artificiale”.

Nel quadro di una domanda di capacità computazionale in forte crescita, l’intesa segnala una traiettoria chiara: la costruzione di infrastrutture AI ibride, in cui GPU e CPU specializzate convivono all’interno di pipeline sempre più complesse. L’architettura ARM, grazie alla sua efficienza e scalabilità, si candida a diventare uno degli elementi chiave di questo equilibrio, soprattutto per sostenere la crescita dell’AI agentica su scala industriale.

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato sulle novità tecnologiche

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome