Meta Llama 4, l’intelligenza artificiale multimodale fa un nuovo passo avanti

Meta Llama 4

Meta ha annunciato il rilascio di quella che l’azienda definisce la più avanzata suite di modelli che supporta l’intero ecosistema Llama.

Meta ha presentato Llama 4 Scout e Llama 4 Maverick, i primi modelli multimodali nativi open-weight con un supporto senza precedenti della lunghezza del contesto e i primi costruiti con un’architettura di tipo MoE (mixture-of-experts).

L’azienda ha inoltre presentato in anteprima Llama 4 Behemoth, che il team descrive come uno degli LLM più intelligenti al mondo e il più potente che Meta abbia mai realizzato, che servirà da “insegnante” per i nuovi modelli dell’azienda.

Questi modelli Llama 4 – afferma Meta – segnano l’inizio di una nuova era per l’ecosistema Llama. Il team ha progettato due modelli efficienti della serie Llama 4: Llama 4 Scout, un modello a 17 miliardi di parametri attivi con 16 esperti, e Llama 4 Maverick, un modello a 17 miliardi di parametri attivi con 128 esperti. Il primo si adatta a una singola GPU NVIDIA H100 (con quantizzazione Int4), mentre il secondo si adatta a un singolo host H100.

Meta Llama 4Secondo Meta, Llama 4 Scout è il miglior modello multimodale al mondo nella sua categoria ed è più potente di tutti i modelli Llama della generazione precedente, pur essendo compatibile con una singola GPU NVIDIA H100. Inoltre, Llama 4 Scout offre una finestra di contesto di 10M, leader del settore, e secondo il team offre risultati migliori rispetto a Gemma 3, Gemini 2.0 Flash-Lite e Mistral 3.1 su un’ampia gamma di benchmark ampiamente riportati.

Riguardo a Llama 4 Maverick, Meta afferma che è il miglior modello multimodale della sua categoria, battendo GPT-4o e Gemini 2.0 Flash in un’ampia gamma di benchmark, e ottenendo risultati paragonabili a quelli del nuovo DeepSeek v3 per quanto riguarda il ragionamento e il coding, con meno della metà dei parametri attivi. Secondo il team Llama 4 Maverick offre il miglior rapporto prestazioni/costo della categoria, con una versione sperimentale di chat che ha ottenuto un ELO di 1417 su LMArena.

Il team ha poi anche addestrato un modello teacher, Llama 4 Behemoth, che secondo Meta supera GPT-4.5, Claude Sonnet 3.7 e Gemini 2.0 Pro su benchmark incentrati sulle materie scientifiche, come MATH-500 e GPQA Diamond. Anche se l’azienda non sta ancora rilasciando Llama 4 Behemoth perché è ancora in fase di training, Meta ha condiviso alcuni dettagli tecnici sul suo approccio.

È possibile scaricare i modelli Llama 4 Scout e Llama 4 Maverick su llama.com e Hugging Face.

Sul blog di Meta AI sono disponibili ulteriori dettagli tecnici sui nuovi modelli.

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato sulle novità tecnologiche

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome