Stability AI e Arm portano l’audio generativo on-device negli smartphone

Stability AI Arm

Stability AI rende più accessibili i suoi modelli di intelligenza artificiale generativa all’avanguardia grazie alla partnership con Arm, la cui tecnologia – sottolinea lo specialista dell’AI – alimenta il 99% degli smartphone a livello globale.

Insieme, le due aziende hanno realizzato un qualcosa che una volta si pensava fosse impossibile, facendo funzionare Stable Audio Open, il modello text-to-audio all’avanguardia di Stability AI, interamente su CPU Arm senza richiedere una connessione a Internet, per la prima volta.

Poiché l’intelligenza artificiale generativa diventa sempre più parte integrante delle attività delle aziende e dei creatori di contenuti professionisti, sottolinea Stability AI, è fondamentale che i modelli e flussi di lavoro siano facilmente accessibili ovunque essi operano, fornendo un’integrazione perfetta nelle loro pipeline di produzione di media visivi.

Con questa crescente domanda, è fondamentale garantire che i modelli funzionino in modo efficiente anche all’edge, mette in evidenza Stability AI, che afferma: questa collaborazione consente la generazione di effetti sonori, campioni audio ed elementi di produzione in pochi secondi, il tutto su dispositivo e offline.

All’MWC di Barcellona l’azienda presenta applicazioni reali di media generativi in modalità edge, dimostrando come il suo modello text-to-audio on-device consenta una generazione audio rapida e di alta qualità.

L’ottimizzazione di Stable Audio Open per i dispositivi mobili – condivide il team – è iniziata come una sfida significativa, con una generazione audio iniziale su una CPU Arm che richiedeva 240 secondi. Distillando il modello e utilizzando lo stack software di Arm, compresi i kernel matmul int8 di KleidiAI in ExecuTorch tramite XNNPack, Stability AI e Arm hanno ridotto il tempo di generazione di un clip di 11 secondi a meno di 8 secondi su CPU Armv9, con un tempo di risposta 30 volte superiore.

Grazie all’esecuzione interamente su CPU Arm, Stable Audio Open è ora accessibile senza requisiti hardware pesanti, rendendolo disponibile a chiunque abbia un dispositivo mobile compatibile.

L’audio è solo l’inizio, afferma il team, il cui obiettivo è quello di portare sull’edge tutti i modelli all’avanguardia di Stability AI nel campo dell’immagine, del video e del 3D. Questa partnership con Arm è un passo fondamentale per consentire la generazione di media di alta qualità direttamente sui dispositivi mobili in tutte le modalità di media visivi, trasformando il modo in cui i visual media vengono creati.

È possibile ottenere ulteriori informazioni sulla partnership e vedere una demo sulla pagina web sul sito di Arm qui, nonché sulla pagina di Stability AI nel catalogo dei partner Arm.

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato sulle novità tecnologiche

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome