Ciao a tutti. Nuovo episodio di Le voci dell’AI. Questo è il numero sedici.

Abbiamo parlato di recente dell’impegno del governo inglese nel creare un modello di intelligenza artificiale nazionale, Brit-GPT, come è stato chiamato da qualcuno, e dell’investimento necessario per il training di un modello di formazione come quello.

Oggi parliamo ancora di AI e governi, ma per una ragione completamente diversa, il diritto d’autore. Stavolta non parliamo del governo inglese, ma di quello giapponese.

È passato quasi un anno dal momento in cui i modelli di AI generativa come DALL·E e Stability Diffusion hanno trasformato il modo in cui creiamo immagini e le industrie che dipendono dalla creazione e manipolazione di quelle immagini.

Prima di tutto, praticamente tutti i produttori di film al mondo hanno incorporato l’AI generativa nei loro processi lavorativi.

Seconda cosa, a uno a uno tutti i software di manipolazione delle immagini stanno adottando i modelli di AI text-to-image per trasformare funzionalità esistenti o creare funzionalità completamente nuove.

Per esempio, quando parliamo di funzionalità trasformate, non possiamo non pensare ad Adobe, che ha appena integrato il suo sistema di AI generativa Firefly in Photoshop e quindi adesso potete estendere una foto o una illustrazione esistente, creando un nuovo contenuto da zero ai bordi dell’immagine.

La stessa cosa è stata annunciata la settimana scorsa da stability.ai come parte della suite Clipdrop.

Mentre Adobe usa un modello di AI proprietario e chiama la sua funzione generative fill, Clipdrop usa il modello di AI chiamato Stable Diffusion XL, che è ancora in fase di beta, e chiama la sua funzione Uncrop.

Vi faccio vedere come funziona Uncrop in uno scenario difficilissimo.

Questo è il ritaglio di una foto che ho usato per un’intervista rilasciata di recente.

Questa la stessa foto, ma meno ritagliata, quindi potete vedere più dettagli ai bordi dell’immagine.

Se avete seguito Le voci dell’AI per un po’, avete già familiarità con l’opera d’arte della foto: è quella alle mie spalle in questo video e in molti altri.

Adesso riprendo l’immagine originale, quella ritagliata e chiedo a Uncrop di estenderla.

Questo è il risultato.

Il modello di AI generativa Stability Diffusion Extra Large non riesce a riprodurre esattamente lo stile dell’artista che ha creato questa opera d’arte, ma fa un lavoro più che soddisfacente rispetto ad altre tecniche che abbiamo usato fino ad oggi.

Okay, ritorniamo ai vari modi in cui l’AI generativa sta trasformando le industrie che ruotano intorno alla produzione e manipolazione di immagini.

Quando parliamo di nuove funzionalità introdotte dall’AI generativa, non possiamo non menzionare la startup Roll AI, che usa un modello proprietario per creare effetti cinematografici che normalmente richiedono l’uso di equipaggiamento professionale molto costoso e molto ingombrante.

Per esempio, grazie all’AI generativa Roll riesce a simulare l’effetto cinematografico della cosiddetta carrellata, il dolly shot, come lo chiamano gli inglesi, o una panoramica in un normalissimo video catturato con uno smartphone.

E poi, ovviamente, oltre a trasformare funzionalità esistenti e abilitare nuove funzioni per la manipolazione delle immagini, l’AI generativa oggi ci permette di creare immagini di qualità altissima come quelle generate dalla startup Midjourney e interi videoclip, come quelli generati dalla startup Runway.

Tutte queste immagini e porzioni di immagini vengono generate dai vari modelli di intelligenza artificiale che sono stati istruiti, addestrati, se preferite dire così, con un data set di milioni di immagini catturate su Internet.

Molte delle immagini infinite in questi data set non sono state pubblicate con una licenza open-source di qualche tipo e in molti casi le startup che sviluppano questi modelli di AI di fondazione non hanno chiesto il permesso per utilizzare quelle immagini.

E quindi che succede quando uno degli strumenti di cui abbiamo parlato oggi prende ispirazione dalle immagini del data set per generare qualcosa di nuovo, come ad esempio quella porzione di immagine ai bordi del mio ritratto o le immagini di una delle clip generate da web? Ci sono varie battaglie legali in corso al momento ormai da mesi contro stability.ai, contro Midjourney, contro OpenAI e probabilmente contro chiunque produca modelli di AI generativa.

Queste battaglie legali probabilmente finiranno solo con una sentenza della Corte Suprema delle varie giurisdizioni del pianeta.

La cosa più importante da sapere è che finché i tribunali più importanti di tutto il mondo non si pronunceranno in merito, e potrebbero volerci anni, le aziende di tutto il mondo che usano l’AI per generare immagini potrebbero ricevere la richiesta di pagamento per i diritti d’autore e la richiesta di risarcimento dei danni per aver violato le leggi sul copyright delle nazioni in cui operano.

Per evitare questo rischio ai propri clienti e un danno d’immagine, fornitori tecnologici come Adobe hanno addestrato dei modelli di fondazione da zero utilizzando solo immagini libere dai diritti d’autore.

Il risultato è che il modello AI di Firefly ha più difficoltà nel generare immagini di certi soggetti e i risultati, almeno in questa prima fase, sono un po’ deludenti a confronto di quello che riesce a fare per esempio Midjourney, ma Adobe può contare su ampie risorse.

Una expertise in intelligenza artificiale senza pari è una comunità enorme, costantemente al lavoro per produrre nuove immagini; quindi, col tempo Firefly potrebbe riuscire a colmare la distanza con i competitor di oggi. Nel frattempo, i clienti di Adobe non rischiano una causa legale.

Adobe è così sicura di questo che ha cominciato a offrire una clausola di risarcimento per i clienti che usano Flynn nel caso questi clienti dovessero essere giudicati colpevoli di aver causato un danno violando involontariamente la proprietà intellettuale di un artista o di un’organizzazione Adobe offre il rimborso del debito accumulato.

Questa però non è una soluzione ideale. Al momento è difficilissimo sviluppare un buon modello di fondazione usando esclusivamente immagini non soggetto a copyright.

Come ha fatto Adobe, stabilitiy.ai, la startup che ha creato Stable Diffusion, permette agli artisti e alle organizzazioni di escludere le proprie immagini dal data set.

Stability.ai li userà per fare l’addestramento di Stable Diffusion 3.0 e dei modelli successivi.

Questo approccio è molto rischioso per le startup che sono sul mercato. il rischio è di rilasciare modelli di qualità via via inferiore anziché superiore, perché la quantità di immagini del data-set viene ridotta da un numero crescente di artisti e organizzazioni che richiedono la rimozione dei loro lavori e quando c’è questo tipo di incertezza nel mercato molte meno startup si assumono il rischio.

E se ci sono meno startup che si assumono il rischio, meno probabilità di innovazione.

Chi rimane nel mercato sono fornitori tecnologici di prima grandezza come Adobe che non hanno più la pressione competitiva delle startup a forzare il rilascio di soluzioni innovative e quindi chi perde è il cliente finale.

Per evitare questo tipo di stagnazione ed evitare di aspettare i tempi lunghissimi delle Corti Supreme che devono pronunciarsi su questi temi completamente nuovi, il governo giapponese ha fatto una cosa inaspettata.

Il ministro giapponese dell’educazione Cultura, sport, scienza e tecnologia ha dichiarato che le leggi giapponesi che regolano il copyright non proteggeranno i diritti d’autore per le immagini finite nel data set dai vari modelli di AI generativa che esistono oggi sul mercato.

Chiunque potrà utilizzare qualunque immagine ottenuta in qualunque modo, anche illegalmente, per il training dei propri modelli e questi modelli di AI potranno avere scopo di ricerca o utilizzo commerciale.

Il Giappone, che è la terza economia più grande del mondo, ambisce a diventare un leader di mercato nell’intelligenza artificiale.

La preoccupazione del governo è che le leggi sul copyright o l’incertezza a proposito di quelle leggi agisca come deterrente per l’innovazione.

E quindi, mentre le nazioni come gli Stati Uniti e il Regno Unito stanno ancora considerando il da farsi, il Giappone chiarisce la posizione in maniera non fraintendibile, una decisione eccezionale su un argomento complicatissimo che potrebbe influenzare sia il reddito pro capite della nazione per gli anni a venire, sia il modo in cui i legislatori delle altre nazioni del mondo si pronunceranno su questo tema.

Ok, ci fermiamo qui per questa settimana. Come sempre, scrivetemi, e fatemi sapere cosa pensano i vostri studi legali a proposito di questo tema.