Stable Diffusion 3: il nuovo modello text-to-image arriva il 12 giugno

Stable Diffusion 3

Al Computex 2024, il CTO e co-interim CEO di Stability AI Christian Laforte ha annunciato ufficialmente la data di rilascio di Stable Diffusion 3 Medium: è fissata per il 12 giugno.

Stability AI ha annunciato che gli utenti potranno effettuare il download dei pesi da Hugging Face di quello che l’azienda ha definito il suo modello text-to-image più avanzato finora.

La società di intelligenza artificiale aveva pubblicato circa tre mesi fa un paper di ricerca che approfondisce la tecnologia sottostante a Stable Diffusion 3 e aveva spiegato che la nuova architettura Multimodal Diffusion Transformer (MMDiT) utilizza set di pesi separati per le rappresentazioni delle immagini e del linguaggio, migliorando la comprensione del testo e le capacità ortografiche rispetto alle versioni precedenti.

Ad aprile l’azienda ha reso le API di Stable Diffusion 3 e Stable Diffusion 3 Turbo disponibili sulla Stability AI Developer Platform. Contestualmente, Stability AI aveva annunciato che – in linea con l’impegno dell’azienda per un’AI generativa aperta – intendeva rendere disponibili i pesi del modello per il self-hosting con una Stability AI Membership nel prossimo futuro.

Questo prossimo futuro ha ora una data precisa, condivisa dal co-CEO dell’azienda Christian Laforte al Computex 2024: il 12 giugno.

Laforte ha condiviso che il team ha portato avanti un intenso lavoro sul nuovo modello, soprattutto in fatto di sicurezza, e che ora l’azienda ritiene sia pronto per una distribuzione più ampia.

L’importante passo avanti del modello di nuova generazione è soprattutto nel Multimodal Diffusion Transformer, che determina, tra le altre cose, una migliore comprensione del prompt. Stable Diffusion 3 Medium dovrebbe offrire anche un maggiore fotorealismo, e la capacità di evitare sgradevoli artefatti che sono comuni nei modelli AI di generazione di immagini, come errori nelle mani e nei volti.

Il nuovo modello dovrebbe presentare inoltre dei miglioramenti nelle prestazioni su sistemi sia enterprise sia consumer, grazie all’ottimizzazione nelle dimensioni e nell’efficienza, nel fine tuning e nella tipografia.

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato sulle novità tecnologiche

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome