01net

Intel porta il deep learning nella periferia della rete

Intel ha realizzato l’unità di elaborazione visiva (VPU, Vision Processing Unit) Movidius Myriad X, che costituisce un ulteriore avanzamento nel portafoglio di soluzioni di intelligenza artificiale end-to-end e deep learning per dare maggiore autonomia a droni, robotica, videocamere intelligenti e strumenti di realtà virtuale.

Myriad X è il primo System-on-a-Chip (SoC) dotato di un Neural Compute Engine (motore di elaborazione neurale) dedicato per accelerare le inferenze del deep learning alla periferia della rete.

Si tratta di un blocco hardware on chip progettato per eseguire reti neurali profonde ad alta velocità e a basso consumo senza rinunciare all’accuratezza, consentendo ai dispositivi di vedere, comprendere e rispondere all’ambiente circostante in tempo reale.

Le VPU Movidius raggiungono alte prestazioni a basso consumo con tre elementi architetturali per fornire prestazioni elevate costanti con carichi di lavoro di deep learning e visione artificiale: un array di processori vettoriali VLIW programmabili con set di istruzioni orientato ai carichi di lavoro di visione artificiale e deep learning; acceleratori hardware che supportano elaborazione del segnale delle immagini, visione artificiale e inferenze di deep learning; un fabric di memoria intelligente che minimizza il movimento dei dati sul chip.

Il minuscolo formato e l’elaborazione integrata sono ideali per le soluzioni di dispositivi autonomi.

Oltre al Neural Compute Engine, Myriad X combina imaging, elaborazione visiva e inferenze del deep learning in tempo reale

Dispone di processori vettoriali VLIW programmabili a 128 bit: eseguono simultaneamente molteplici flussi di imaging e applicazioni visive con la flessibilità dei 16 processori vettoriali ottimizzati per i carichi di lavoro della visione artificiale.

È dotato di un maggior numero di linee MIPI configurabili: collegano fino a 8 videocamere RGB con risoluzione HD direttamente a Myriad X con le 16 linee MIPI comprese nel ricco set di interfacce, per supportare fino a 700 milioni di pixel al secondo di throughput di elaborazione del segnale delle immagini.

Utilizzano oltre 20 acceleratori hardware per eseguire attività quali flusso ottico e profondità stereoscopica senza introdurre un ulteriore carico di elaborazione.

Ha 2,5 MB di memoria on chip omogenea: l’architettura di memoria on chip centralizzata consente fino a 450 GB al secondo di larghezza di banda interna, riducendo al minimo la latenza e il consumo energetico minimizzando il trasferimento dei dati off chip.