Mistral AI rilascia nuovi modelli per la comprensione del parlato e per il coding

Mistral AI

Come afferma Mistral AI, l’azienda francese specializzata nel campo dell’intelligenza artificiale, la voce è stata la prima interfaccia dell’umanità: molto prima della scrittura o della digitazione, ci ha permesso di condividere idee, coordinare il lavoro e costruire relazioni.

Ora che i sistemi digitali stanno diventando sempre più avanzati, la voce sta tornando a essere la forma più naturale di interazione uomo-macchina. Tuttavia, secondo Mistral AI i sistemi attuali sono ancora limitati: inaffidabili, proprietari e troppo fragili per un uso nel mondo reale. Dal punto di vista dell’azienda francese, per colmare questo divario servono strumenti con capacità di trascrizione superiore, comprensione approfondita, fluidità multilingue e distribuzione aperta e flessibile.

In un tale contesto, Mistral AI ha annunciato il rilascio dei modelli Voxtral per accelerare questo futuro contraddistinto da una di interazione uomo-macchina più naturale.

Questi modelli all’avanguardia per la comprensione del parlato sono disponibili in due versioni: una variante da 24B per applicazioni su scala di produzione e una variante da 3B per utilizzi in locale o su dispositivi edge. Entrambe le versioni sono rilasciate sotto licenza Apache 2.0.

Mistral AI ha inoltre reso disponibili i modelli tramite la sua API, offrendo anche un endpoint ottimizzato per la sola trascrizione, che garantisce un’efficienza dei costi senza precedenti, afferma l’azienda francese.

Mistral AI
Fonte e credit: Mistral AI

Entrambi i modelli Voxtral vanno oltre la semplice trascrizione, offrendo funzionalità che includono:

  • Contesto di ampie dimensioni: con una lunghezza del contesto di 000 token, Voxtral gestisce fino a 30 minuti di audio per la trascrizione o 40 minuti per la comprensione.
  • Q&A e sintesi integrate: consente di porre domande direttamente sul contenuto audio o di generare sintesi strutturate, senza dover concatenare modelli separati ASR e linguistici.
  • Nativi multilingue: rilevamento automatico della lingua e prestazioni all’avanguardia nelle lingue più diffuse al mondo (inglese, spagnolo, francese, portoghese, hindi, tedesco, olandese, italiano, tra le altre), permettendo ai team di servire un pubblico globale con un singolo sistema.
  • Chiamata di funzioni direttamente dalla voce: abilita l’attivazione diretta di funzioni backend, workflow o chiamate API in base alle intenzioni espresse vocalmente, trasformando l’interazione vocale in comandi eseguibili senza passaggi intermedi di parsing.
  • Elevata capacità di elaborazione del testo: mantiene le capacità di comprensione del testo del modello linguistico di base, Mistral Small 3.1.

Queste funzionalità – sottolinea Mistral AI – rendono i modelli Voxtral ideali per interazioni nel mondo reale e azioni successive, come sintesi, risposte, analisi e insight. Per casi d’uso sensibili ai costi, afferma Mistral AI, Voxtral Mini Transcribe supera OpenAI Whisper a meno della metà del prezzo. Per usi premium, secondo la società sviluppatrice Voxtral Small eguaglia le prestazioni di ElevenLabs Scribe, anche in questo caso a meno della metà del costo.

Mistral AI offre anche funzionalità per Voxtral progettate per aziende con requisiti più elevati in termini di sicurezza, scalabilità o specifici del settore.

Nuovi modelli Devstral da Mistral AI

Oltre a Voxtral, Mistral AI di recente ha anche introdotto un miglioramento delle capacità di coding agentico con i nuovi modelli Devstral, presentando Devstral Medium e un aggiornamento di Devstral Small.

Questi modelli sono stati sviluppati grazie alla collaborazione tra Mistral AI e All Hands AI, con una forte enfasi sulla generalizzazione a diversi prompt e agentic scaffold.

Il nuovo Devstral Small 1.1 è rilasciato sotto licenza Apache 2.0 ed è all’avanguardia tra i modelli aperti per agenti di codice. Devstral Medium è disponibile tramite la API di Mistral AI e secondo l’azienda stabilisce un nuovo punto sulla frontiera di Pareto costo/prestazioni, superando Gemini 2.5 Pro e GPT 4.1 a un quarto del prezzo.

Maggiori informazioni sui nuovi modelli di Mistral AI sono disponibili sul sito dell’azienda.

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato sulle novità tecnologiche

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome