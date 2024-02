Google ha presentato una nuova generazione di modelli aperti per aiutare sviluppatori e ricercatori a costruire l’intelligenza artificiale in modo responsabile.

Gemma è una famiglia di modelli open leggeri e all’avanguardia, costruiti con la stessa ricerca e tecnologia utilizzata per creare i modelli Gemini.

Sviluppato da Google DeepMind e da altri team di Google, Gemma si ispira a Gemini. Insieme al peso dei modelli, Google sta rilasciando anche strumenti per sostenere l’innovazione degli sviluppatori, promuovere la collaborazione e guidare l’uso responsabile dei modelli Gemma.

Gemma è disponibile in tutto il mondo a partire da oggi.

Di seguito, i principali dettagli da conoscere, messi in evidenza da Google:

La società americana sta rilasciando i pesi dei modelli in due misure: Gemma 2B e Gemma 7B. Ciascuna dimensione viene rilasciata con varianti pre-addestrate e instruction-tuned.

Un nuovo Responsible Generative AI Toolkit fornisce indicazioni e strumenti essenziali per creare applicazioni AI più sicure con Gemma.

Google fornisce toolchain per l’inferenza e il fine-tuning supervisionato (SFT) in tutti i principali framework: JAX, PyTorch e TensorFlow attraverso Keras 3.0

I notebook Colab e Kaggle pronti all’uso, insieme all’integrazione con strumenti popolari come Hugging Face, MaxText, NVIDIA NeMo e TensorRT-LLM , rendono facile iniziare a lavorare con Gemma.

I modelli Gemma pre-addestrati e instruction-tuned possono essere eseguiti su laptop, workstation o Google Cloud con una facile distribuzione su Vertex AI e Google Kubernetes Engine (GKE).

L'ottimizzazione su più piattaforme hardware per l'AI garantisce prestazioni leader del settore, afferma Google, comprese le GPU NVIDIA e le TPU di Google Cloud.

. I termini d’utilizzo consentono l’uso e la distribuzione commerciale responsabile per tutte le organizzazioni, indipendentemente dalle dimensioni.

Google spiega che i modelli Gemma condividono componenti tecnici e infrastrutturali con Gemini, il modello di intelligenza artificiale più grande e più capace di Google. Ciò consente a Gemma 2B e 7B di ottenere prestazioni elevate per le loro dimensioni rispetto ad altri modelli aperti. Inoltre, i modelli Gemma possono essere eseguiti direttamente su un computer portatile o desktop dello sviluppatore.

In particolare, sottolinea Google, Gemma supera modelli significativamente più grandi nei principali benchmark, pur rispettando i rigorosi standard di produzione sicura e responsabile dell’azienda. Per maggiori dettagli su prestazioni, composizione del set di dati e metodologie di modellazione, è possibile consultare la relazione tecnica.

Gemma è stato progettato tenendo conto dei principi AI di Google. Per rendere i modelli preaddestrati di Gemma sicuri e affidabili, l’azienda ha utilizzato tecniche automatizzate per filtrare alcune informazioni personali e altri dati sensibili dai set di training. Inoltre, ha utilizzato un’ampia messa a punto e l’apprendimento per rinforzo da feedback umano (RLHF) per allineare i modelli instruction-tuned a comportamenti responsabili. Per comprendere e ridurre il profilo di rischio dei modelli Gemma, Google dichiara di aver condotto solide valutazioni, tra cui il red-teaming manuale, l’adversarial testing automatizzato e le valutazioni delle capacità del modello per le attività pericolose. Queste valutazioni sono descritte nella Model Card.

Insieme a Gemma, Google rilascia anche un nuovo Responsible Generative AI Toolkit, per aiutare sviluppatori e ricercatori a stabilire le priorità per la creazione di applicazioni AI sicure e responsabili.

Il toolkit comprende:

Classificazione della sicurezza : Google fornisce una metodologia innovativa per costruire robusti classificatori di sicurezza con esempi minimi.

: Google fornisce una metodologia innovativa per costruire robusti classificatori di sicurezza con esempi minimi. Debug : uno strumento di debug del modello aiuta a studiare il comportamento di Gemma e a risolvere potenziali problemi.

: uno strumento di debug del modello aiuta a studiare il comportamento di Gemma e a risolvere potenziali problemi. Guida: è possibile accedere alle migliori pratiche per i costruttori di modelli, basate sull’esperienza di Google nello sviluppo e nella distribuzione di modelli linguistici di grandi dimensioni.

È possibile fare il fine-tuning dei modelli Gemma sui propri dati per adattarli a specifiche esigenze applicative, come la riepilogazione o la retrieval-augmented generation (RAG). Gemma supporta un’ampia gamma di strumenti e sistemi:

Strumenti multi-framework : è possibile portate il proprio framework preferito, con implementazioni di riferimento per l’inferenza e la messa a punto attraverso Keras 3.0 multi-framework, PyTorch nativo, JAX e Hugging Face Transformers.

: è possibile portate il proprio framework preferito, con implementazioni di riferimento per l’inferenza e la messa a punto attraverso Keras 3.0 multi-framework, PyTorch nativo, JAX e Hugging Face Transformers. Compatibilità cross-device : i modelli Gemma vengono eseguiti su tutti i tipi di dispositivi più diffusi, tra cui laptop, desktop, IoT , mobile e cloud, consentendo così capacità AI ampiamente accessibili.

: i modelli Gemma vengono eseguiti su tutti i tipi di dispositivi più diffusi, tra cui laptop, desktop, , mobile e cloud, consentendo così capacità AI ampiamente accessibili. Piattaforme hardware all’avanguardia : Google ha collaborato con NVIDIA per ottimizzare Gemma per le GPU NVIDIA, dal data center al cloud fino ai PC RTX AI locali, garantendo prestazioni e integrazione allo stato dell’arte con tecnologie all’avanguardia.

: Google ha collaborato con per ottimizzare Gemma per le GPU NVIDIA, dal al cloud fino ai PC RTX AI locali, garantendo prestazioni e integrazione allo stato dell’arte con tecnologie all’avanguardia. Ottimizzato per Google Cloud: Vertex AI offre un ampio set di strumenti MLOps con una gamma di opzioni di messa a punto e un’implementazione con un solo clic grazie alle ottimizzazioni di inferenza integrate. La personalizzazione avanzata è disponibile con gli strumenti Vertex AI completamente gestiti o con GKE autogestito, compresa l’implementazione in infrastrutture efficienti dal punto di vista dei costi su GPU, TPU e CPU da entrambe le piattaforme.

Gemma – sottolinea Google – è stato costruito per la comunità aperta di sviluppatori e ricercatori che alimentano l’innovazione dell’intelligenza artificiale. È possibile iniziare a lavorare subito con Gemma grazie all’accesso gratuito a Kaggle, a un livello gratuito per i notebook Colab e a 300 dollari di crediti per i nuovi utenti di Google Cloud. I ricercatori possono anche richiedere crediti Google Cloud fino a 500.000 dollari per accelerare i loro progetti.

Per saperne di più su Gemma e accedere alle guide rapide, si può visitare il sito ai.google.dev/gemma.