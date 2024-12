IBM ha presentato una ricerca rivoluzionaria sulla tecnologia ottica che potrebbe migliorare drasticamente il modo in cui i data center addestrano ed eseguono i modelli generativi di intelligenza artificiale. I ricercatori hanno sperimentato un nuovo processo di co-packaged optics (CPO), la tecnologia ottica di nuova generazione, per consentire la connettività all’interno dei data center alla velocità della luce attraverso l’ottica, a complemento degli attuali cavi elettrici a corto raggio. Progettando e assemblando la prima guida d’onda ottica polimerica (PWG) di successo annunciata pubblicamente per alimentare questa tecnologia, i ricercatori IBM hanno dimostrato come la CPO ridefinirà il modo in cui l’industria informatica trasmette dati ad alta larghezza di banda tra chip, schede di circuito e server.

Oggi – spiega IBM – la tecnologia in fibra ottica trasporta dati ad alta velocità su lunghe distanze, gestendo quasi tutto il traffico commerciale e di comunicazione del mondo con la luce anziché con l’elettricità. Sebbene i data center utilizzino la fibra ottica per le loro reti di comunicazione esterne, i rack dei data center gestiscono ancora prevalentemente le comunicazioni su cavi elettrici in rame. Questi fili collegano gli acceleratori GPU che possono passare più della metà del loro tempo inattivi, in attesa di dati da altri dispositivi in un processo di training distribuito e di grandi dimensioni che può comportare spese ed energia significative.

I ricercatori IBM hanno dimostrato un modo per portare la velocità e la capacità dell’ottica all’interno dei data center. In un paper tecnico, IBM presenta un nuovo prototipo di modulo CPO in grado di abilitare la connettività ottica ad alta velocità. Questa tecnologia potrebbe aumentare in modo significativo la larghezza di banda delle comunicazioni dei data center, riducendo al minimo i tempi di inattività delle GPU e accelerando drasticamente l’elaborazione dell’intelligenza artificiale. Questa innovazione di ricerca, come descritto dai ricercatori IBM, abiliterebbe:

Riduzione dei costi di scalabilità dell’intelligenza artificiale generativa grazie a una riduzione del consumo energetico di oltre 5 volte rispetto alle interconnessioni elettriche di fascia media, estendendo al contempo la lunghezza dei cavi di interconnessione dei data center da uno a centinaia di metri.

grazie a una riduzione del consumo energetico di oltre 5 volte rispetto alle interconnessioni elettriche di fascia media, estendendo al contempo la lunghezza dei cavi di interconnessione dei data center da uno a centinaia di metri. Training più rapido dei modelli di intelligenza artificiale , che consente agli sviluppatori di addestrare un Large Language Model (LLM) fino a cinque volte più velocemente con CPO rispetto al cablaggio elettrico convenzionale. Il CPO potrebbe ridurre il tempo necessario per addestrare un LLM standard da tre mesi a tre settimane , con un aumento delle prestazioni grazie all’utilizzo di modelli più grandi e di un maggior numero di GPU.

“Con l’AI generativa che richiede sempre più energia e potenza di elaborazione, il data center deve evolversi e l’ottica co-packaged può rendere questi data center a prova di futuro”, ha dichiarato Dario Gil, SVP e Direttore della Ricerca di IBM. “Con questa innovazione, i chip di domani comunicheranno come i cavi in fibra ottica trasportano i dati all’interno e all’esterno dei data center, inaugurando una nuova era di comunicazioni più veloci e sostenibili in grado di gestire i carichi di lavoro dell’IA del futuro”.

Negli ultimi anni, sottolinea IBM, i progressi della tecnologia dei chip hanno permesso di impacchettare densamente i transistor su un chip; la tecnologia dei chip a 2 nanometri di IBM può contenere più di 50 miliardi di transistor. La tecnologia CPO mira a scalare la densità di interconnessione tra gli acceleratori consentendo ai produttori di chip di aggiungere percorsi ottici che collegano i chip su un modulo elettronico oltre i limiti degli attuali percorsi elettrici. Il paper di IBM illustra come queste nuove strutture ottiche ad alta densità di banda, unite alla trasmissione di più lunghezze d’onda per canale ottico, abbiano il potenziale di aumentare la larghezza di banda tra i chip fino a 80 volte rispetto alle connessioni elettriche.

L’innovazione di IBM, così come descritta, consentirebbe ai produttori di chip di aggiungere un numero di fibre ottiche sei volte superiore ai bordi di un chip fotonico al silicio, la cosiddetta “beachfront density”, rispetto all’attuale tecnologia CPO all’avanguardia. Ogni fibra, circa tre volte la larghezza di un capello umano, potrebbe estendersi per una lunghezza che va dai centimetri alle centinaia di metri e trasmettere terabit di dati al secondo. Il team IBM ha assemblato un PWG ad alta densità con canali ottici a passo 50 micrometri, accoppiati adiabaticamente a guide d’onda fotoniche in silicio, utilizzando processi di assemblaggio standard.

Il paper indica inoltre che questi moduli CPO con PWG a passo di 50 micrometri sono i primi a superare tutti i test di stress richiesti per la produzione. I componenti sono stati sottoposti ad ambienti ad alta umidità e a temperature comprese tra -40°C e 125°C, nonché a test di durata meccanica per confermare che le interconnessioni ottiche possono piegarsi senza rompersi o perdere dati. Inoltre, i ricercatori hanno dimostrato la tecnologia PWG con un passo di 18 micrometri. L’impilamento di quattro PWG consentirebbe di ottenere fino a 128 canali di connettività a tale passo.

La tecnologia CPO consente un nuovo percorso per soddisfare le crescenti esigenze di prestazioni dell’intelligenza artificiale, con il potenziale di sostituire le comunicazioni off-module da elettriche a ottiche. Continua – sottolinea l’azienda – la storia di leadership di IBM nell’innovazione dei semiconduttori, che comprende anche la prima tecnologia di chip a 2 nm, la prima implementazione delle tecnologie di processo a 7 nm e 5 nm, i transistor Nanosheet, i transistor verticali (VTFET), le DRAM a cella singola e le fotoresistenze amplificate chimicamente.

I ricercatori hanno completato il lavoro di progettazione, modellazione e simulazione per il CPO ad Albany, New York, che il Dipartimento del Commercio degli Stati Uniti ha recentemente scelto come sede del primo National Semiconductor Technology Center (NSTC) americano, l’acceleratore NSTC EUV. I ricercatori hanno assemblato prototipi e testato moduli presso lo stabilimento IBM di Bromont, in Quebec, uno dei più grandi siti di assemblaggio e test di chip del Nord America. Parte del corridoio dei semiconduttori del Nord-Est tra gli Stati Uniti e il Canada, lo stabilimento IBM di Bromont è da decenni leader mondiale nel packaging di chip.