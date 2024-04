La prossima generazione dell’infrastruttura su larga scala di Meta – sottolinea l’azienda di Mark Zuckerberg – è stata costruita pensando all’intelligenza artificiale, per supportare nuovi prodotti di AI generativa, sistemi di raccomandazione e ricerca avanzata basata sull’AI. Si tratta di un investimento che l’azienda prevede di far crescere negli anni a venire, dato che i requisiti di calcolo per supportare i modelli di intelligenza artificiale aumentano di pari passo con la loro sofisticazione.

L’anno scorso l’azienda ha presentato Meta Training and Inference Accelerator (MTIA) v1, il suo acceleratore di inferenza AI di prima generazione che ha progettato internamente pensando ai carichi di lavoro AI di Meta. È stato progettato specificamente per i modelli di raccomandazione deep learning dell’azienda, che stanno migliorando una serie di esperienze nelle applicazioni e tecnologie di Meta.

Meta descrive MTIA come una scommessa a lungo termine per fornire l’architettura più efficiente per i carichi di lavoro unici di Meta. Poiché i carichi di lavoro AI diventano sempre più importanti per i prodotti e servizi dell’azienda, questa efficienza sarà fondamentale per la capacità di fornire le migliori esperienze agli utenti in tutto il mondo. MTIA v1 è stato un passo importante per migliorare l’efficienza di calcolo della infrastruttura e per supportare meglio gli sviluppatori software dell’azienda, nella creazione di modelli AI che faciliteranno nuove e migliori esperienze per gli utenti.

La nuova generazione di MTIA fa parte del più ampio programma di sviluppo full-stack di silicio custom e specifico per il settore di Meta, che risponde ai carichi di lavoro e sistemi unici dell’azienda. Questa nuova versione di MTIA raddoppia l’ampiezza di calcolo e la larghezza di banda della memoria rispetto al chip precedente, pur mantenendo un legame stretto con i workload. Il nuovo chip è stato progettato per servire in modo efficiente i modelli di classificazione e raccomandazione che forniscono raccomandazioni di alta qualità agli utenti.

L’architettura di questo chip è fondamentalmente incentrata sulla capacità di fornire il giusto equilibrio tra calcolo, larghezza di banda di memoria e capacità di memoria per servire i modelli di classificazione e raccomandazione.

MTIA è stato implementato nei data center di Meta e sta ora servendo i modelli in produzione. L’azienda afferma di vedere già i risultati positivi di questo programma, che le permette di dedicare e investire in una maggiore potenza di calcolo per i suoi carichi di lavoro AI più intensivi.

I risultati ottenuti finora – afferma l’azienda – dimostrano che questo chip MTIA è in grado di gestire modelli di ranking e di raccomandazione sia a bassa che ad alta complessità, componenti fondamentali dei prodotti Meta. Poiché l’azienda controlla l’intero stack, secondo Meta può ottenere una maggiore efficienza rispetto alle GPU disponibili in commercio.

MTIA – ha inoltre annunciato l’azienda – sarà un tassello importante della roadmap a lungo termine per costruire e scalare l’infrastruttura più potente ed efficiente possibile per i carichi di lavoro AI unici di Meta.

La società di Mark Zuckerberg sta progettando il suo silicio custom per far sì che funzioni in collaborazione con la l’infrastruttura esistente e con il nuovo hardware più avanzato (comprese le GPU di nuova generazione) che potrebbero essere utilizzaye in futuro. Per soddisfare le sue ambizioni in materia di silicio personalizzato, Meta ritiene di non dover investire solo in silicio di calcolo, ma anche in larghezza di banda, rete e capacità di memoria, nonché in altri sistemi hardware di nuova generazione.

E attualmente Meta afferma di avere in corso diversi programmi volti ad ampliare la portata di MTIA, compreso il supporto per i carichi di lavoro GenAI.

La corsa – e la sfida – dell’intelligenza artificiale e dell’AI generativa si tiene dunque sempre più non solo sul campo software, ma anche su quello hardware.