xAI rilascia Grok 4 Fast, modello di ragionamento performante ed efficiente

Grok 4 Fast

xAI ha presentato Grok 4 Fast, che l’azienda descrive come il suo più recente progresso nei modelli di ragionamento efficienti in termini di costi. 

Basato sulle conoscenze acquisite da xAI con Grok 4, Grok 4 Fast secondo il team offre prestazioni all’avanguardia sia nel settori enterprise che in quello consumer, con una sorprendente efficienza dei token. 

Grazie a queste caratteristiche, questo modello può essere in grado di ampliare i confini dell’IA più compatta e veloce, rendendo il ragionamento di alta qualità accessibile a un numero maggiore di utenti e sviluppatori. 

Grok 4 Fast offre un’efficienza in termini di costi che xAI definisce allo stato dell’arte, funzionalità di ricerca web e X all’avanguardia, una finestra di contesto di 2 milioni di token e un’architettura unificata che combina modalità reasoning e non-reasoning in un unico modello.

Soprattutto – la sua qualità principale –, Grok 4 Fast stabilisce una nuova frontiera nell’intelligenza efficiente in termini di costi, superando Grok 3 Mini nei benchmark di ragionamento e riducendo drasticamente i costi dei token.

Il team ha utilizzato il reinforcement learning su larga scala per massimizzare la densità di intelligenza di Grok 4 Fast. Nelle valutazioni interne dell’azienda, Grok 4 Fast raggiunge prestazioni paragonabili a quelle di Grok 4 nei benchmark, utilizzando in media il 40% in meno di thinking token.

Questo aumento del 40% dell’efficienza dei token di Grok 4 Fast, combinato con un prezzo per token significativamente più basso, si traduce secondo xAI in una riduzione del 98% del prezzo per ottenere le stesse prestazioni sui benchmark di frontiera di Grok 4. Come verificato da una revisione indipendente di Artificial Analysis, Grok 4 Fast mostra un rapporto prezzo/intelligenza all’avanguardia rispetto ad altri modelli disponibili per il pubblico sull’Artificial Analysis Intelligence Index.

Grok 4 Fast è stato addestrato end-to-end con l’apprendimento per rinforzo (reinforcement learning, RL) nell’uso degli strumenti. È eccellente nel decidere quando ricorrere a strumenti come l’esecuzione di codice o la navigazione web.

Ad esempio, spiega xAI, Grok 4 Fast mostra capacità di ricerca agentica all’avanguardia, navigando senza soluzione di continuità sul web e su X per arricchire le query con dati in tempo reale. Salta da un link all’altro, acquisisce contenuti multimediali (comprese immagini e video su X) e sintetizza i risultati in modo molto veloce.

Grok 4 Fast è allo stato dell’arte anche in termini di convenienza economica nel dominio generale. Nella Search Arena di LMArena, grok-4-fast-search (nome in codice: menlo) si aggiudica il primo posto con uno score di 1163, con un vantaggio di 17 punti su o3-search. La sua superiore efficienza di ragionamento e densità di intelligenza gli consentono di superare modelli molto più grandi in compiti reali legati alla ricerca, afferma xAI. 

In precedenza, modalità di ragionamento separate richiedevano modelli distinti. Grok 4 Fast introduce un’architettura unificata in cui il ragionamento (lunga catena di pensieri) e il non ragionamento (risposte rapide) sono gestiti dagli stessi pesi del modello, guidati tramite system prompt. Questa unificazione secondo xAI riduce la latenza end-to-end e i costi dei token, rendendo Grok 4 Fast ideale per le applicazioni in tempo reale.

In grok.com, ciò si traduce in transizioni fluide: risposte immediate per query semplici o ragionamenti estesi per quelle complesse. Nell’API xAI, gli sviluppatori possono mettere a punto questo comportamento, ottimizzandolo in termini di velocità o profondità.

Grok 4 Fast è ora disponibile per tutti gli utenti nelle app grok.com, iOS e Android. Nelle modalità Fast e Auto, sottolinea xAI, gli utenti potranno notare un significativo miglioramento nelle ricerche e nelle query di ricerca di informazioni. Inoltre, le query complesse in modalità Auto utilizzeranno Grok 4 Fast, che fornirà un’esperienza molto più veloce senza perdita di qualità, afferma l’azienda. Per la prima volta, tutti gli utenti, compresi quelli gratuiti, avranno accesso all’ultimo modello di xAI senza restrizioni, segnando un passo avanti verso la democratizzazione dell’IA avanzata, mette in evidenza il team.

Per ulteriori informazioni, benchmark e prezzi, è possibile consultare il blog di xAI.

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato sulle novità tecnologiche

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome