Black Forest Labs lancia Flux.1 Kontext per la generazione e modifica delle immagini

Black Forest Labs Flux.1 Kontext

Black Forest Labs ha annunciato il rilascio di FLUX.1 Kontext, una suite di modelli generativi basati su flow matching che consente di generare e modificare immagini.

A differenza dei modelli text-to-image esistenti, sottolinea Black Forest Labs, la famiglia FLUX.1 Kontext supporta la generazione di immagini in-context, permettendo di utilizzare come input sia testo che immagini, ed estrarre o modificare senza soluzione di continuità concetti visivi per produrre nuove rappresentazioni coerenti. In pratica, Flux.1 Kontext consente la generazione e modifica di testo e immagini coerente e consapevole del contesto.

Black Forest Labs sostiene che FLUX.1 Kontext rappresenta un’importante evoluzione rispetto ai classici modelli text-to-image, unificando la generazione di immagini da testo e la modifica istantanea delle immagini basata su testo. In quanto modello a flusso multimodale, combina una coerenza avanzata nella rappresentazione dei soggetti, una solida comprensione del contesto e capacità di modifica localizzata, con una potente sintesi text-to-image.

Che si tratti di ideazione, bozzetti, progettazione concettuale o semplicemente per divertimento, la generazione text-to-image resta una componente fondamentale dell’AI generativa odierna, sottolinea Black Forest Labs. I modelli FLUX.1 Kontext offrono risultati di alto livello nella generazione di immagini, con un’eccellente aderenza ai prompt, resa fotorealistica e una tipografia competitiva—il tutto con velocità di inferenza fino a 8 volte superiori rispetto ai principali modelli attuali (come GPT-Image), afferma la società sviluppatrice.

Black Forest Labs Flux.1 KontextI modelli FLUX.1 Kontext vanno oltre la semplice generazione text-to-image. A differenza dei precedenti modelli basati su flow, che permettono solo la generazione a partire da testo, i modelli FLUX.1 Kontext comprendono e possono creare anche a partire da immagini esistenti. Con FLUX.1 Kontext è possibile modificare un’immagine di input tramite semplici istruzioni testuali, rendendo l’editing flessibile e immediato—senza necessità di fine-tuning o di workflow complessi di modifica.

Le funzionalità principali della suite FLUX.1 Kontext includono:

  • Coerenza dei soggetti: mantiene invariati elementi unici di un’immagine—come un personaggio di riferimento o un oggetto—attraverso scene e ambientazioni differenti.
  • Modifica localizzata: consente interventi mirati su specifici elementi dell’immagine senza alterare il resto.
  • Stile di riferimento: genera nuove scene mantenendo gli stili unici di un’immagine di riferimento, guidati da prompt testuali.
  • Velocità interattiva: latenza minima sia nella generazione che nell’editing delle immagini.

Black Forest Labs Flux.1 KontextFlux.1 Kontext – spiega inoltre Black Forest Labs – consente di aggiungere iterativamente altre istruzioni e di basarsi sulle modifiche precedenti, perfezionando la creazione passo dopo passo con una latenza minima, preservando la qualità dell’immagine e la coerenza del personaggio.

All’interno della suite FLUX.1 Kontext Black Forest Labs ha presentato due nuovi modelli di generazione in-context integrati nell’API BFL.

FLUX.1 Kontext [pro] – Un modello pionieristico per l’editing rapido e iterativo delle immagini. Un modello unico che offre editing localizzato, modifiche generative in-context e classica generazione immagine-da-testo, con l’inconfondibile qualità FLUX.1.

FLUX.1 Kontext [pro] accetta come input sia testo che immagini di riferimento, consentendo modifiche mirate su aree specifiche dell’immagine e trasformazioni complesse di intere scene.

Con prestazioni fino a un ordine di grandezza superiori rispetto ai precedenti modelli all’avanguardia, afferma Black Forest Labs, FLUX.1 Kontext [pro] è un modello pionieristico per l’editing iterativo: è infatti il primo a permettere agli utenti di costruire su modifiche precedenti attraverso più passaggi, mantenendo coerenza di personaggi, identità, stili e tratti distintivi tra scene e prospettive diverse.

FLUX.1 Kontext [max] – Massime prestazioni ad alta velocità. Il nuovo modello sperimentale di Black Forest Labs migliora sensibilmente l’aderenza ai prompt, la generazione tipografica e garantisce un’elevata coerenza nell’editing—il tutto senza alcun compromesso sulla velocità.

FLUX.1 Kontext [max] e FLUX.1 Kontext [pro] sono disponibili su KreaAI, Freepik, Lightricks, OpenArt e LeonardoAI e tramite i partner infrastrutturali di Black Forest Labs FAL, Replicate, Runware, DataCrunch,TogetherAI e ComfyOrg.

Black Forest Labs ritiene che la ricerca aperta e la condivisione dei pesi siano fondamentali per un’innovazione tecnologica sicura. Il team ha sviluppato una variante a pesi aperti, FLUX.1 Kontext [dev] — un modello diffusion transformer leggero da 12 miliardi di parametri, adatto alla personalizzazione e compatibile con il codice di inferenza della precedente versione FLUX.1 [dev].

L’azienda rende disponibile FLUX.1 Kontext [dev] in una release beta privata, destinata alla ricerca e ai test sulla sicurezza. Alla sua uscita pubblica, FLUX.1 Kontext [dev] sarà distribuito attraverso i partner: FAL, Replicate, Runware, DataCrunch, TogetherAI e HuggingFace.

FLUX.1 Kontext presenta alcune limitazioni nella sua attuale implementazione. Sessioni di editing multi-turno troppo estese possono introdurre artefatti visivi che compromettono la qualità dell’immagine. Il modello, in alcuni casi, può non seguire con precisione le istruzioni, ignorando occasionalmente specifiche richieste del prompt. La conoscenza del mondo rimane limitata, influenzando la capacità del modello di generare contenuti contestualmente accurati. Inoltre, il processo di distillazione può introdurre artefatti visivi che incidono sulla fedeltà del risultato finale.

Ulteriori informazioni e benchmark sono disponibili sul sito di Black Forest Labs.

Una demo dell’API FLUX: il BFL Playground

Fin dal lancio, afferma Black Forest Labs, all’azienda è stato chiesto con costanza di rendere i modelli più semplici da testare e dimostrare. Per questo il team ora presenta il FLUX Playground: un’interfaccia semplificata per provare i modelli FLUX più avanzati, senza bisogno di integrazione tecnica.

Il Playground consente a sviluppatori e team di validare casi d’uso, dimostrare le funzionalità agli stakeholder e sperimentare la generazione avanzata di immagini in tempo reale. Che si tratti di valutare la fattibilità tecnica o mostrare i risultati ai decisori, il Playground offre un accesso immediato per esplorare le potenzialità di FLUX prima di passare a una piena implementazione via API.

La missione di BFL – dichiara l’azienda – è costruire i modelli e l’infrastruttura più avanzati per la generazione multimediale. Il Playground è pensato come punto d’ingresso all’API BFL, progettato per accelerare il percorso dall’esplorazione alla messa in produzione.

BFL Playground è già disponibile.

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato sulle novità tecnologiche

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome