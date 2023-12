Google ha annunciato quello che l’azienda descrive come un significativo aggiornamento delle capacità di generazione di immagini di Google Cloud, con Imagen 2, la tecnologia text-to-image più avanzata della società americana, che ora è generalmente disponibile per i clienti di Vertex AI sulla allowlist (cioè approvati per l’accesso).

Imagen 2 su Vertex AI consente ai clienti di Google Cloud di personalizzare e distribuire Imagen 2 con strumenti intuitivi, un’infrastruttura completamente gestita e funzioni integrate di privacy e sicurezza.

Sviluppato con la tecnologia DeepMind di Google, Imagen 2 – afferma l’azienda – offre una qualità dell’immagine notevolmente migliorata e una serie di funzioni che consentono agli sviluppatori di creare immagini per i loro casi d’uso specifici, tra cui:

Generazione di immagini di alta qualità, fotorealistiche, ad alta risoluzione ed esteticamente gradevoli a partire da prompt in linguaggio naturale.

Rendering di testi in più lingue per creare immagini con sovraimpressioni di testo accurate.

Generazione di logo per creare loghi aziendali o di prodotto e sovrapporli alle immagini.

Domande e risposte visive per generare didascalie dalle immagini e per ottenere risposte testuali informative per le domande sui dettagli delle immagini.

Google sottolinea che l’impegno di indennizzo di Vertex AI copre ora Imagen su Vertex AI, che include Imagen 2 e i futuri aggiornamenti generalmente disponibili del modello che alimenta il servizio. L’azienda dichiara di adottare un approccio duplice di indennizzo del copyright, all’avanguardia nel settore, che può garantire ai clienti la massima tranquillità nell’utilizzo dei suoi prodotti di AI generativa.

Imagen 2 su Vertex AI – spiega Google – presenta una serie di funzioni di generazione di immagini per aiutare le aziende a creare immagini che corrispondono ai requisiti specifici del loro brand, con la stessa affidabilità e governance di livello enterprise a cui i clienti sono abituati con Imagen.

Le nuove caratteristiche ora disponibili in Imagen 2 includono:

Miglioramento della qualità delle immagini : Imagen 2, assicura Google, è in grado di ottenere risultati accurati e di alta qualità grazie a una migliore comprensione dell’immagine e del testo e a una serie di nuove tecniche di training e modellazione.

: Imagen 2, assicura Google, è in grado di ottenere risultati accurati e di alta qualità grazie a una migliore comprensione dell’immagine e del testo e a una serie di nuove tecniche di training e modellazione. Supporto per il rendering del testo : le tecnologie text-to-image spesso hanno difficoltà a fare correttamente il rendering del testo. Se al modello viene richiesto di generare un’immagine di un oggetto con una parola o una frase specifica, ad esempio, può essere difficile garantire che la frase corretta faccia parte dell’immagine di output. Imagen 2 risolve questo problema, offrendo alle organizzazioni un livello di controllo più profondo per il branding e la messaggistica.

: le tecnologie text-to-image spesso hanno difficoltà a fare correttamente il rendering del testo. Se al modello viene richiesto di generare un’immagine di un oggetto con una parola o una frase specifica, ad esempio, può essere difficile garantire che la frase corretta faccia parte dell’immagine di output. Imagen 2 risolve questo problema, offrendo alle organizzazioni un livello di controllo più profondo per il branding e la messaggistica. Generazione di logo : Imagen 2 è in grado di generare un’ampia varietà di loghi creativi e realistici, tra cui emblemi, marchi e loghi astratti, per aziende, marchi e prodotti. È inoltre in grado di sovrapporre questi loghi su prodotti, abbigliamento, biglietti da visita e altre superfici.

: Imagen 2 è in grado di generare un’ampia varietà di loghi creativi e realistici, tra cui emblemi, marchi e loghi astratti, per aziende, marchi e prodotti. È inoltre in grado di sovrapporre questi loghi su prodotti, abbigliamento, biglietti da visita e altre superfici. Didascalie e risposte alle domande : le funzionalità avanzate di Imagen 2 per la comprensione delle immagini consentono ai clienti di creare didascalie descrittive e lunghe e di ottenere risposte dettagliate alle domande sugli elementi dell’immagine.

: le funzionalità avanzate di Imagen 2 per la comprensione delle immagini consentono ai clienti di creare didascalie descrittive e lunghe e di ottenere risposte dettagliate alle domande sugli elementi dell’immagine. Suggerimenti multilingue : Oltre all’inglese, Imagen 2 è in fase di lancio con il supporto di altre sei lingue (cinese, hindi, giapponese, coreano, portoghese e spagnolo) in anteprima, e molte altre saranno rilasciate all’inizio del 2024, ha annunciato Google. Questa funzione include la possibilità di tradurre tra prompt e output, ad esempio, un prompt in spagnolo ma specificando che l’output deve essere in portoghese.

: Oltre all’inglese, Imagen 2 è in fase di lancio con il supporto di altre sei lingue (cinese, hindi, giapponese, coreano, portoghese e spagnolo) in anteprima, e molte altre saranno rilasciate all’inizio del 2024, ha annunciato Google. Questa funzione include la possibilità di tradurre tra prompt e output, ad esempio, un prompt in spagnolo ma specificando che l’output deve essere in portoghese. Sicurezza: Imagen 2 include precauzioni di sicurezza integrate per garantire che le immagini generate siano in linea con i principi dell’AI responsabile di Google. Ad esempio, Imagen 2 è integrato con il servizio sperimentale di watermarking digitale di Google, alimentato da SynthID di Google DeepMind, che consente ai clienti iscritti di generare watermark invisibili e verificare le immagini generate da Imagen. Imagen 2 include anche filtri di sicurezza completi che aiutano a prevenire la generazione di contenuti potenzialmente dannosi.

Tra i clienti di questa tecnologia, Google cita Snap, che utilizza Imagen per aiutare gli abbonati a Snapchat+ a esprimere la loro creatività. Con la nuova modalità AI Camera, gli utenti possono toccare un pulsante, digitare una richiesta o sceglierne una pre-selezionata e generare una scena da condividere con la famiglia e gli amici o da postare sulla propria storia.

“Imagen è il modello text-to-image più scalabile con la sicurezza e la qualità d’immagine di cui abbiamo bisogno“, ha dichiarato Josh Siegel, Senior Director of Product di Snap. “Uno dei principali vantaggi di Imagen per Snap è che possiamo concentrarci su ciò che sappiamo fare meglio, ovvero il design del prodotto e il modo in cui appare e fa sentire. Sappiamo che quando lavoriamo a nuovi prodotti come l’AI Camera Mode, possiamo contare sulla sicurezza del marchio, sulla scalabilità e sull’affidabilità di Google Cloud“.

Anche Shutterstock – mette in evidenza Google – si è distinto come innovatore nell’introduzione dell’intelligenza artificiale nella produzione creativa, tra cui il primo a lanciare un generatore di immagini AI di provenienza etica, ora potenziato con Imagen su Vertex AI. Con il generatore di immagini AI di Shutterstock, gli utenti possono trasformare semplici prompt di testo in immagini uniche e sorprendenti, consentendo loro di creare alla velocità della loro immaginazione. Il sito web di Shutterstock comprende una collezione ricercabile di oltre 16.000 immagini Imagen, tutte disponibili per la licenza.

“Esistiamo per consentire al mondo di raccontare le proprie storie colmando il divario tra idea ed esecuzione. La varietà è fondamentale per il processo creativo, ed è per questo che continuiamo a integrare le tecnologie più recenti e più avanzate nel nostro generatore di immagini e nelle nostre funzioni di editing, purché siano costruite su dati di provenienza responsabile“, ha dichiarato Chris Loy, Director of AI Services di Shutterstock. “Il modello Imagen su Vertex AI è un’importante aggiunta al nostro generatore di immagini AI e siamo entusiasti di vedere come questo modello, con la sua continua evoluzione, consentirà ai nostri utenti di ottenere maggiori capacità creative“.

Anche Canva – spiega Google – utilizza Imagen su Vertex AI per dare vita alle idee, con milioni di immagini generate con il modello fino ad oggi. Gli utenti possono accedere a Imagen come app direttamente all’interno di Canva e, con un semplice prompt di testo, generare un’immagine accattivante che si adatti alle loro esigenze di design.

“La collaborazione con Google Cloud ci consente di continuare a utilizzare l’intelligenza artificiale generativa per innovare il processo di progettazione e aumentare l’immaginazione“, ha dichiarato Danny Wu, Head of AI di Canva. “Con Imagen, i nostri oltre 170 milioni di utenti mensili possono beneficiare dei miglioramenti della qualità delle immagini per migliorare la creazione di contenuti su scala. Il nuovo modello e le nuove funzionalità permetteranno alla nostra community di trasformare le idee in immagini reali con il minor attrito possibile“.

Per iniziare a utilizzare Imagen 2 su Vertex AI, è possibile consultare la documentazione o contattare il proprio account representative di Google Cloud per aderire al Trusted Tester Program.