Mistral AI rilascia Magistral, il suo primo modello di ragionamento

Mistral AI Magistral

Mistral AI ha annunciato Magistral, il primo modello reasoning dell’azienda francese, che eccelle nel ragionamento specifico del dominio, trasparente e multilingue.

Il miglior pensiero umano – sottolinea il team di Mistral AI – non è lineare: si snoda attraverso la logica, l’intuizione, l’incertezza e la scoperta. I modelli linguistici di ragionamento ci hanno permesso di aumentare e delegare all’intelligenza artificiale il pensiero complesso e la comprensione profonda, migliorando la nostra capacità di risolvere i problemi che richiedono una deliberazione e un’analisi precise e graduali.

Ma questo ambito è ancora in fase nascente. La mancanza di profondità specialistica necessaria per i problemi specifici del dominio, la trasparenza limitata e l’incoerenza del ragionamento nel linguaggio desiderato sono solo alcuni dei limiti noti dei primi modelli di ragionamento.

Ora Mistral AI presenta il suo ultimo contributo alla ricerca sull’intelligenza artificiale con Magistral, il suo primo modello di ragionamento. Rilasciato sia in versione open che enterprise, Magistral – spiega il team – è stato progettato per ragionare in modi a noi familiari, apportando competenze in tutti i domini professionali, ragionamenti trasparenti che si possono seguire e verificare e una profonda flessibilità multilingue.

Magistral è un modello a doppio rilascio incentrato sul ragionamento del mondo reale e sul miglioramento guidato dal feedback.

Mistral AI sta rilasciando il modello in due varianti: Magistral Small, una versione open-source a 24B parametri, e Magistral Medium, una versione enterprise più potente. Magistral Medium ha ottenuto il 73,6% su AIME2024 e il 90% con il voto di maggioranza @64. Magistral Small ha ottenuto rispettivamente il 70,7% e l’83,3%.

Mistral AI MagistralIl modello ragiona in modo nativo: La catena di pensiero di Magistral funziona in tutte le lingue e gli alfabeti del mondo, sottolinea il team. Ed è adatto a un’ampia gamma di casi d’uso aziendali, da calcoli strutturati e logica programmatica ad alberi decisionali e sistemi basati su regole.

Con la nuova modalità Think e le Flash Answers di Le Chat, è possibile ottenere risposte a una velocità 10 volte superiore rispetto alla maggior parte dei concorrenti, afferma Mistral AI.

Il rilascio è supportato dall’ultimo paper di Mistral che contiene valutazioni complete di Magistral, della infrastruttura di training, dell’algoritmo di apprendimento per rinforzo e delle nuove osservazioni per l’addestramento dei modelli di ragionamento.

Poiché Mistral AI ha reso Magistral Small open-source, l’azienda stessa desidera che la community esamini, modifichi e sviluppi la sua architettura e i suoi processi di ragionamento per accelerare ulteriormente l’emergere di modelli linguistici di pensiero. I modelli aperti precedenti dell’azienda sono già stati utilizzati dalla community per progetti interessanti come ether0 e DeepHermes 3.

Magistral è ottimizzato per la logica a più fasi, migliorando l’interpretabilità e fornendo un processo di pensiero tracciabile nel linguaggio dell’utente, a differenza dei modelli generici.

A partire da questa versione, Mistral AI si propone di iterare rapidamente il modello per cui l’azienda afferma che gli utenti possono aspettarsi un costante miglioramento dei modelli.

Il modello eccelle nel mantenere un ragionamento ad alta fedeltà in numerose lingue. Magistral – spiega il team – è particolarmente adatto a ragionare in lingue come inglese, francese, spagnolo, tedesco, italiano, arabo, russo e cinese semplificato.

Con Flash Answers in Le Chat, Magistral Medium raggiunge un throughput di token particolarmente veloce e questo permette di ragionare in tempo reale e di ricevere feedback dagli utenti, su scala.

Mistral AI MagistralSecondo Mistral AI, Magistral è ideale per usi generici che richiedono un’elaborazione del pensiero più lunga e una migliore precisione rispetto agli LLM non ragionanti. Dalla ricerca legale alle previsioni finanziarie, dallo sviluppo di software alla narrazione creativa, questo modello risolve sfide in più fasi in cui trasparenza e precisione sono fondamentali.

Basato sui modelli di punta dell’azienda, Magistral è progettato per la ricerca, la pianificazione strategica, l’ottimizzazione operativa e il processo decisionale basato sui dati, sia che si tratti di eseguire la valutazione del rischio e la modellazione con più fattori, sia che si tratti di calcolare le finestre di consegna ottimali in presenza di vincoli.

Il team afferma che i professionisti dei settori regolamentati, del settore legale, finanziario, sanitario e governativo, ottengono ragionamenti tracciabili per soddisfare i requisiti di conformità. Ogni conclusione può essere rintracciata attraverso i suoi passaggi logici, garantendo la verificabilità di ambienti ad alto rischio con un’intelligenza artificiale specializzata nel settore.

Magistral migliora i casi d’uso del coding e dello sviluppo: rispetto ai modelli non ragionanti, migliora significativamente la pianificazione del progetto, l’architettura del backend, la progettazione del frontend e l’ingegnerizzazione dei dati attraverso azioni sequenziate e multi-step che coinvolgono strumenti esterni o API.

I primi test hanno dimostrato che Magistral è un eccellente compagno creativo, afferma il team di Mistral AI, che lo consiglia per la scrittura creativa e lo storytelling, con il modello in grado di produrre testi coerenti o, se necessario, deliziosamente eccentrici.

Magistral Small è un modello open-weight ed è disponibile per il self-deployment sotto licenza Apache 2.0: è possibile scaricarlo da Hugging Face.

È possibile provare una versione di anteprima di Magistral Medium in Le Chat o tramite API su La Plateforme.

Magistral Medium è disponibile anche su Amazon SageMaker e presto su IBM WatsonX, Azure AI e Google Cloud Marketplace.

Per soluzioni aziendali e custom, comprese le implementazioni on-premises, è possibile contattare il team di vendita di Mistral AI.

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato sulle novità tecnologiche

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome