xAI ha presentato Grok-1.5, l’ultimo modello della società guidata da Elon Musk, in grado di comprendere un contesto più lungo e di ragionare in modo avanzato. Grok-1.5 – ha annunciato il team – sarà disponibile nei prossimi giorni per i primi tester e per gli utenti Grok esistenti sulla piattaforma X (ex Twitter).

Con il rilascio dei pesi del modello e dell’architettura di rete di Grok-1, due settimane fa, il team ha valutato i progressi compiuti da xAI fino allo scorso novembre: da allora, mette in evidenza l’azienda, ha migliorato le capacità di ragionamento e di risoluzione dei problemi per il suo ultimo modello, Grok-1.5.

Uno dei miglioramenti più evidenti di Grok-1.5 – afferma il team – è la sua performance nei task di coding e matematica. Nei test interni dell’azienda, Grok-1.5 ha ottenuto un punteggio del 50,6% nel benchmark MATH e del 90% nel benchmark GSM8K, due benchmark matematici che coprono un’ampia gamma di problemi del livello delle scuole elementari e superiori. Inoltre, ha ottenuto un punteggio del 74,1% nel benchmark HumanEval, che valuta la generazione di codice e le capacità di risoluzione dei problemi.

Una nuova caratteristica di Grok-1.5 è la capacità di elaborare contesti lunghi fino a 128K token all’interno della finestra di contesto. Questo permette a Grok di avere una capacità di memoria fino a 16 volte superiore alla lunghezza del contesto precedente, consentendogli di utilizzare informazioni provenienti da documenti molto più lunghi.

Inoltre, spiega xAI, il modello è in grado di gestire richieste più lunghe e complesse, pur mantenendo la capacità di seguire le istruzioni quando la context window si espande. Nella valutazione Needle In A Haystack (NIAH), Grok-1.5 ha dimostrato potenti capacità di recupero del testo incorporato in contesti lunghi fino a 128K token, ottenendo risultati perfetti, afferma il team.

Le ricerche all’avanguardia sui Large Language Model (LLM), eseguite su cluster di GPU di grandi dimensioni, richiedono un’infrastruttura robusta e flessibile. Grok-1.5 è costruito su un framework di training distribuito personalizzato basato su JAX, Rust e Kubernetes. Questo stack di training – sottolinea xAI – consente al team di prototipare idee e addestrare nuove architetture su scala con il minimo sforzo.

Una delle sfide principali dell’addestramento di LLM su grandi cluster di calcolo è la massimizzazione dell’affidabilità e del tempo di attività del lavoro di training. L’orchestratore di addestramento custom di xAI garantisce che i nodi problematici vengano rilevati automaticamente ed espulsi dal job di training. Il team ha anche ottimizzato il checkpoint, il caricamento dei dati e il riavvio del job di training per ridurre al minimo i tempi di inattività in caso di guasto.

Grok-1.5 – ha annunciato xAI – sarà presto disponibile per i primi tester e l’azienda accoglierà il feedback degli utenti per migliorare il modello, man mano che lo distribuirà gradualmente a un pubblico più ampio. Il team introdurrà anche diverse nuove funzionalità nei prossimi giorni, ha annunciato xAI.

Di recente, Elon Musk ha anche annunciato che Grok-1 sarà disponibile anche per gli utenti di X abbonati al piano Premium, non solo Premium+.

xAI è una società specializzata nella ricerca e sviluppo nel campo dell’intelligenza artificiale. Il team è costituito da esperti del settore, provenienti da precedenti esperienze in DeepMind, OpenAI, Google Research, Microsoft Research, Tesla e altre importanti realtà, ed è guidato da Elon Musk, CEO di Tesla e SpaceX.