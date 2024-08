xAI – la società di intelligenza artificiale di Elon Musk – ha rilasciato una early preview di Grok-2, che l’azienda definisce un significativo passo avanti rispetto al suo precedente modello Grok-1.5, con funzionalità di frontiera nella chat, nel coding e nel ragionamento.

Al contempo, xAI sta introducendo Grok-2 mini, un “fratello minore”, ma capace, di Grok-2. Una prima versione di Grok-2 è stata testata nella leaderboard di LMSYS con il nome di “sus-column-r”: il team sottolinea che al momento supera sia Claude 3.5 Sonnet che GPT-4-Turbo.

Grok-2 e Grok-2 mini sono attualmente in versione beta su X, e verso la fine del mese xAI renderà disponibili entrambi i modelli attraverso la sua API enterprise. L’azienda non specifica se ci sono limitazioni geografiche per l’accesso al nuovo modello sulla piattaforma X.

Il team ha condiviso di aver introdotto una prima versione di Grok-2 con il nome di “sus-column-r” nell’arena dei chatbot LMSYS, un popolare benchmark competitivo di modelli linguistici. Il modello ha superato sia Claude che GPT-4 nella classifica LMSYS in termini di punteggio Elo complessivo.

Internamente, il team utilizza un processo analogo per valutare i suoi modelli. I tutor di intelligenza artificiale di xAI si confrontano con i modelli dell’azienda attraverso una serie di task che riflettono le interazioni del mondo reale con Grok. Durante ogni interazione, agli AI Tutor vengono presentate due risposte generate dal modello: selezionano la risposta migliore in base a criteri specifici delineati nelle linee guida dell’azienda.

Il team si è focalizzato sulla valutazione delle capacità del modello in due aree chiave: seguire le istruzioni e fornire informazioni accurate e concrete. Grok-2 – afferma xAI – ha mostrato miglioramenti significativi nel ragionamento con i contenuti recuperati e nelle capacità di utilizzo degli strumenti, come l’identificazione corretta delle informazioni mancanti, il ragionamento sulle sequenze di eventi e lo scarto dei post non pertinenti.

xAI ha valutato i modelli di nuova generazione su una serie di parametri accademici che comprendevano ragionamento, comprensione della lettura, matematica, scienze e programmazione. Sia Grok-2 che la versione mini hanno dimostrato miglioramenti significativi rispetto al precedente modello di xAI, Grok-1.5. Raggiungono livelli di prestazione competitivi rispetto ad altri modelli di frontiera – secondo l’azienda – in aree quali graduate-level science knowledge (GPQA), general knowledge (MMLU, MMLU-Pro) e i problemi di competizione matematica (MATH). Inoltre, Grok-2 eccelle nei compiti basati sulla visione, fornendo prestazioni all’avanguardia nel ragionamento matematico visivo (MathVista) e nella risposta a domande basate su documenti (DocVQA).

Negli ultimi mesi il team ha migliorato continuamente Grok sulla piattaforma X, e ora ha presentato la nuova evoluzione dell’esperienza, con un’interfaccia ridisegnata e nuove funzionalità.

Gli utenti X Premium e Premium+ avranno accesso a due nuovi modelli: Grok-2 e Grok-2 mini. Grok-2 è l’assistente AI all’avanguardia con capacità avanzate di comprensione del testo e della visione, che integra informazioni in tempo reale dalla piattaforma X, accessibile attraverso la scheda Grok dell’app X. Grok-2 mini è il modello compatto ma capace di offrire un equilibrio tra velocità e qualità delle risposte. Rispetto al suo predecessore, afferma il team, il modello di nuova generazione è più intuitivo, maneggevole e versatile in un’ampia gamma di attività, sia che si tratti di cercare risposte, collaborare alla stesura di un testo o risolvere compiti di coding.

In collaborazione con Black Forest Labs, xAI sta inoltre sperimentando il suo modello di generazione di immagini FLUX.1 per espandere le capacità di Grok su X. Gli abbonati a Premium o Premium+ possono aggiornare all’ultima versione dell’app X per poter testare Grok-2 in versione beta.

L’azienda ha anche annunciato che, nel corso di questo mese, rilascerà Grok-2 e Grok-2 mini agli sviluppatori attraverso la nuova piattaforma API enterprise. La prossima API di xAI è costruita su un nuovo stack tecnologico su misura che consente distribuzioni di inferenze multiregionali per un accesso a bassa latenza in tutto il mondo. Fornisce poi funzioni di sicurezza migliorate, come l’autenticazione obbligatoria a più fattori (ad esempio utilizzando Yubikey, Apple TouchID o TOTP), ricche statistiche sul traffico e analisi avanzate della fatturazione (compresa l’esportazione dettagliata dei dati). Offre inoltre un’API di gestione che consente di integrare la gestione di team, utenti e fatturazione negli strumenti e servizi interni esistenti.

Grok-2 e Grok-2 mini sono in fase di lancio su X. Il team si dichiara molto soddisfatto delle loro applicazioni a una serie di funzioni basate sull’intelligenza artificiale, come le capacità di ricerca migliorate, l’approfondimento dei post di X e le funzioni di risposta migliorate. Presto xAI rilascerà un’anteprima della comprensione multimodale come parte integrante dell’esperienza Grok su X e sulle API.

Da quando ha annunciato Grok-1 nel novembre 2023, xAI si è mosso a un ritmo sorprendente, sottolinea l’azienda, guidato da un piccolo team con la massima densità di talenti. xAI ha introdotto Grok-2 con l’intenzione di posizionarsi all’avanguardia nello sviluppo dell’IA. E intende focalizzarsi sul miglioramento delle capacità di ragionamento di base con il suo nuovo cluster di calcolo. xAI è alla ricerca di persone che si uniscano al suo team dedicato alla costruzione delle innovazioni di maggior impatto per il futuro dell’umanità: è possibile candidarsi sul sito dell’azienda.