Il team di Google DeepMind ha aggiunto un nuovo strumento altamente specializzato al toolkit Gemma 3: Gemma 3 270M, un modello compatto da 270 milioni di parametri progettato da zero per un fine-tuning task-specific con forti capacità di instruction-following e strutturare il testo già addestrate.
Negli ultimi mesi, il team ha introdotto Gemma 3 e Gemma 3 QAT, con prestazioni all’avanguardia per acceleratori cloud e desktop singoli. Successivamente, ha annunciato il rilascio completo di Gemma 3n, un’architettura mobile-first che porta l’intelligenza artificiale multimodale potente e in tempo reale direttamente sui dispositivi edge. L’obiettivo è stato quello di fornire strumenti utili agli sviluppatori per creare con l’AI, e questo vivace Gemmaverse ha superato i 200 milioni di download all’inizio del mese.
Ora Gemma 3 270M offre potenti funzionalità di esecuzione delle istruzioni in un modello dalle dimensioni ridotte.
Tra le caratteristiche principali di Gemma 3 270M, spiega il team di Google DeepMind, c’è innanzitutto un’architettura compatta e potente: il nuovo modello ha un totale di 270 milioni di parametri: 170 milioni di parametri di embedding grazie a un ampio vocabolario e 100 milioni per i transformer block. Grazie all’ampio vocabolario di 256k token, il modello è in grado di gestire token specifici e rari, rendendolo un solido modello di base per fare un ulteriore fine-tuning in domini e lingue specifici.
Poi, c’è l’estrema efficienza energetica: un vantaggio chiave di Gemma 3 270M è il suo basso consumo energetico. Test interni di Google su un SoC Pixel 9 Pro mostrano che il modello quantizzato INT4 ha utilizzato solo lo 0,75% della batteria per 25 conversazioni, rendendolo il modello Google Gemma più efficiente dal punto di vista energetico.
Una capacità importante riguarda l’instruction following: un modello ottimizzato per le istruzioni viene rilasciato insieme a un checkpoint pre-addestrato. Sebbene questo modello non sia progettato per casi d’uso conversazionali complessi, spiega il team, è un modello potente che segue le istruzioni generali fin da subito.
Quantizzazione pronta per la produzione: sono disponibili checkpoint Quantization-Aware Trained (QAT), che consentono di eseguire i modelli con precisione INT4 con un degrado minimo delle prestazioni, essenziale per l’implementazione su dispositivi con risorse limitate.
Google sottolinea dunque che Gemma 3 270M è un modello di base di alta qualità che segue bene le istruzioni fin da subito e la cui vera potenza viene sbloccata attraverso una messa a punto accurata. Una volta specializzato, è in grado di eseguire attività come la classificazione di testi e l’estrazione di dati con notevole precisione, velocità ed economicità.
Partendo da un modello compatto e capace, è possibile costruire sistemi di produzione snelli, veloci e notevolmente più economici da gestire.
Gemma 3 270M è progettato per consentire agli sviluppatori di sbloccare un’efficienza ancora maggiore per compiti ben definiti. È il punto di partenza perfetto per creare una flotta di modelli piccoli e specializzati, ciascuno esperto nel proprio compito.
Maggiori informazioni sul modello Gemma 3 270M sono disponibili nel blog di Google per sviluppatori.
Sempre come novità per gli sviluppatori di soluzioni AI, Google ha annunciato anche che Imagen 4, il modello text-to-image più avanzato dell’azienda, è ora disponibile nella Gemini API e in Google AI Studio.
Questa versione segna un significativo passo avanti nella qualità della generazione da testo a immagine, con miglioramenti sostanziali nel rendering del testo rispetto ai modelli precedenti.









