Home Intelligenza Artificiale Inflection-2, il modello AI che sfida PaLM-2, Claude-2 e GPT-4

Inflection-2, il modello AI che sfida PaLM-2, Claude-2 e GPT-4

Inflection AI ha annunciato di aver completato l’addestramento di Inflection-2, che l’azienda descrive come il miglior modello al mondo per la sua classe di calcolo e il secondo LLM più capace al mondo, ad oggi.

La mission di Inflection AI – che si definisce uno “studio AI” e che ha la forma societaria di Public Benefit Corporation – è quella di creare un’intelligenza artificiale personale per tutti. Solo pochi mesi fa il team dell’azienda ha annunciato Inflection-1, il modello linguistico migliore al mondo che attualmente alimenta Pi, che sta per l’appunto per “personal intelligence”.

Il nuovo modello, Inflection-2, secondo il team è sostanzialmente più capace di Inflection-1, dimostrando una migliore conoscenza dei fatti, un migliore controllo stilistico e un facoltà di ragionamento nettamente migliore.

Inflection-2 è stato addestrato su 5.000 GPU NVIDIA H100 in precisione mista fp8 per ~10²⁵ FLOP. Ciò, sottolinea il team, lo colloca nella stessa classe di calcolo di training del modello PaLM 2 Large, fiore all’occhiello di Google, che – secondo Inflection AI – Inflection-2 supera nella maggior parte dei benchmark di prestazioni AI standard, tra cui i ben noti MMLU, TriviaQA, HellaSwag e GSM8k.

inflection-2

Progettato tenendo conto dell’efficienza, Inflection-2 alimenterà presto Pi. Grazie al passaggio dalle GPU A100 alle H100 e all’implementazione altamente ottimizzata dell’inferenza, il team è riuscito a ridurre i costi e ad aumentare la velocità di esecuzione rispetto a Inflection-1, nonostante Inflection-2 sia più volte più grande.

Per l’azienda, si tratta di una importante pietra miliare nel suo percorso verso la realizzazione di un’intelligenza artificiale personale per tutti, e per le nuove capacità che Inflection-2 consentirà a Pi. E il percorso di scalabilità continua: nelle intenzioni c’è ora quella di addestrare modelli ancora più grandi sulla piena capacità del cluster di 22.000 GPU.

Il training di modelli molto grandi – spiega Inflection AI – richiede un livello speciale di cura e attenzione per le questioni di sicurezza, protezione e affidabilità. Inflection dichiara di prendere sul serio queste responsabilità e il suo team di sicurezza continua a lavorare per garantire che questi modelli siano valutati in modo rigoroso e integrino i migliori approcci. Inflection è stata tra le prime organizzazioni a sottoscrivere i Voluntary Commitments della Casa Bianca del luglio 2023 e continua a sostenere gli sforzi per creare meccanismi di allineamento e governance globali per questa tecnologia critica.

Nel presentare Inflection-2, il team ha anche ringraziato i partner NVIDIA, Microsoft e CoreWeave per la loro collaborazione e il loro supporto nella costruzione del cluster AI dell’azienda, che ha reso possibile il training di Inflection-1 e Inflection-2.

Sul proprio sito, l’azienda ha condiviso i benchmark di Inflection-2 confrontati con quelli di altri LLM.

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato sulle novità tecnologiche
css.php