Mistral AI compie un passo importante nella propria evoluzione strategica con il lancio di Forge, una piattaforma progettata per consentire alle aziende non solo di personalizzare modelli esistenti, ma di costruire, addestrare e gestire sistemi di intelligenza artificiale lungo l’intero ciclo di vita, utilizzando dati proprietari e mantenendo il pieno controllo su infrastruttura, sicurezza e governance.
L’annuncio introduce un cambio di paradigma rispetto all’approccio finora dominante nel mercato enterprise, basato su API e tecniche di fine-tuning applicate a modelli general purpose. In questa impostazione, le aziende restano dipendenti da modelli esterni e possono intervenire solo in modo limitato sul comportamento del sistema. Forge si posiziona invece come un’alternativa strutturale: secondo Mistral, l’AI enterprise avanzata richiede la costruzione diretta del modello, non solo la sua personalizzazione superficiale.
Dal fine-tuning ai modelli “frontier” proprietari
Al centro della piattaforma c’è la gestione completa del ciclo di vita del modello. Forge consente di partire dal pre-training su dataset proprietari – quindi dalla costruzione del modello fin dalle sue fondamenta – proseguire con fasi di supervised fine-tuning e adottare tecniche avanzate di allineamento come Direct Preference Optimization (DPO), una metodologia che consente di ottimizzare il comportamento del modello sulla base di preferenze espresse (ad esempio da utenti o annotatori), evitando la complessità delle pipeline di reinforcement learning tradizionali.
A queste si affiancano comunque pipeline di reinforcement learning per i casi in cui sia necessario un ulteriore livello di ottimizzazione. L’intero processo è progettato per essere iterativo e continuo, consentendo un miglioramento progressivo del modello.
L’obiettivo finale non è l’adattamento di un modello esistente, ma la creazione di modelli proprietari di livello frontier, cioè sistemi progettati per raggiungere prestazioni comparabili ai modelli più avanzati disponibili sul mercato, ma costruiti su dati, logiche e obiettivi specifici dell’organizzazione. Questo rappresenta uno spostamento netto: l’AI diventa proprietà intellettuale interna.
Questo approccio riflette una precisa visione: l’AI enterprise non può essere ridotta a un layer applicativo sopra modelli generici, ma deve diventare una capacità strutturale interna. Forge si propone quindi come piattaforma per l’industrializzazione dell’intelligenza artificiale, rivolta in particolare a team AI e ML engineer. Non è quindi una piattaforma per il semplice utilizzo di modelli, ma uno strumento pensato per chi li costruisce, li addestra e ne governa l’evoluzione nel tempo.
Industrializzare il know-how: dati, training e metodologie
Uno degli elementi più rilevanti di Forge è la codifica del know-how sviluppato internamente da Mistral. La piattaforma incorpora infatti training recipes, cioè configurazioni e metodologie già ottimizzate per l’addestramento dei modelli, insieme a strategie di data mixing, che permettono di combinare in modo controllato dataset eterogenei.
A questo si aggiungono pipeline per la generazione di dati sintetici, utilizzati per ampliare, bilanciare o specializzare i dataset reali, e tecniche di training distribuito, che consentono di utilizzare in parallelo grandi quantità di risorse computazionali per ridurre tempi e costi di addestramento.
In questo contesto, la gestione del dato assume un ruolo centrale. Non si tratta solo di utilizzare dati proprietari, ma di progettarli, selezionarli e strutturarli: la curation del dataset diventa un elemento determinante per la qualità del modello e quindi un vero asset competitivo.
In questo quadro, Forge non si limita a utilizzare dati proprietari, ma consente di incorporare quella che può essere definita una vera e propria “conoscenza istituzionale”. I modelli possono essere addestrati su documentazione interna, codebase, dati strutturati e registri operativi, apprendendo non solo informazioni, ma anche il vocabolario, i vincoli e i pattern decisionali che caratterizzano l’organizzazione. Questo permette di sviluppare modelli e agenti in grado di ragionare utilizzando la terminologia interna e di comprendere i workflow aziendali, superando il comportamento generico dei modelli standard e avvicinandosi a una forma di intelligenza artificiale che riflette il funzionamento reale dell’impresa.
Questo approccio trova già applicazione in contesti industriali avanzati. Mistral ha avviato collaborazioni con organizzazioni come ASML, Ericsson, European Space Agency, il gruppo italiano Reply e istituzioni tecnologiche tra Europa e Asia, tra cui DSO National Laboratories e Home Team Science and Technology Agency di Singapore, per addestrare modelli su dati proprietari utilizzati in sistemi complessi e tecnologie strategiche. Un elemento che conferma come la costruzione di modelli su dati interni non sia solo una prospettiva teorica, ma una pratica già in fase di adozione in ambiti ad alta intensità tecnologica.
Infrastruttura, Mistral Compute e automazione del training
Forge è progettata per essere eseguita in ambienti differenti: cluster gestiti da Mistral, cloud pubblici, infrastrutture private o completamente on-premise. Questa flessibilità infrastrutturale è parte integrante della proposta, perché consente di adattare la piattaforma a requisiti di sicurezza, latenza e compliance.
In questo quadro si inserisce anche Mistral Compute, l’infrastruttura proprietaria dell’azienda, che rappresenta uno degli ambienti di riferimento per l’esecuzione dei workload di training e rafforza l’integrazione tra modelli, piattaforma e capacità computazionale.
Un elemento distintivo è l’approccio agent-driven. Forge introduce infatti l’automazione del ciclo di sviluppo dei modelli attraverso agenti software in grado di eseguire esperimenti, generare dati sintetici, orchestrare pipeline e gestire la ricerca degli hyperparameter ottimali, cioè l’ottimizzazione automatica delle impostazioni interne che regolano il processo di apprendimento del modello e che influenzano direttamente qualità, velocità e stabilità dei risultati.
Questo approccio riduce la dipendenza da interventi manuali e accelera significativamente i cicli di iterazione, avvicinando l’AI a un modello di sviluppo sempre più automatizzato.
Architetture avanzate e apprendimento continuo
La piattaforma supporta architetture avanzate, inclusi modelli dense, in cui tutti i parametri contribuiscono a ogni risposta, e mixture-of-experts, architetture che suddividono il modello in componenti specializzate e attivano di volta in volta solo quelle più rilevanti per il compito, migliorando l’efficienza nell’utilizzo delle risorse e la scalabilità. Forge è inoltre progettata per supportare scenari multimodali.
Un altro aspetto chiave è la continuità operativa. I modelli non sono statici, ma possono essere aggiornati, riaddestrati e valutati nel tempo attraverso pipeline di evaluation integrate, che chiudono il ciclo tra training, verifica delle prestazioni e retraining. L’intelligenza artificiale diventa così un processo continuo, integrato nei workflow aziendali, e non un deployment una tantum.
In questo contesto, Forge abilita un’evoluzione ulteriore: i modelli non si limitano a utilizzare dati aziendali, ma incorporano anche la memoria operativa dell’organizzazione, incluse decisioni accumulate nel tempo, vincoli e logiche di funzionamento dei sistemi. L’intelligenza artificiale viene così integrata direttamente all’interno di applicazioni, workflow e policy, diventando parte dell’infrastruttura operativa.
La piattaforma è inoltre progettata con un approccio agent-first, pensata fin dall’origine per essere utilizzata da agenti autonomi in grado di orchestrare pipeline, utilizzare strumenti e prendere decisioni in ambienti complessi. In questo scenario, attività come selezione dei tool, gestione di workflow multi-step e decision-making operativo diventano più affidabili perché basate su modelli addestrati sul contesto reale dell’organizzazione. Forge supporta anche l’ottimizzazione continua attraverso metriche e sistemi di monitoraggio che permettono di evitare regressioni e mantenere le prestazioni allineate agli obiettivi aziendali.
Questo approccio trova applicazione in diversi contesti: dalla pubblica amministrazione, dove i modelli possono essere addestrati su normative, lingue e procedure amministrative, al settore finanziario, fino allo sviluppo software, dove modelli addestrati su codebase proprietarie possono supportare attività come debugging, migrazione, revisione e progettazione dei sistemi. In tutti i casi, l’obiettivo è superare l’AI generica per arrivare a sistemi che riflettono l’intelligenza operativa dell’organizzazione.
Mistral AI, oggi la startup più avanzata dell’ecosistema AI europeo
Mistral AI è una startup francese di intelligenza artificiale fondata nel 2023 da Arthur Mensch (ex Google DeepMind), insieme a Guillaume Lample e Timothée Lacroix (entrambi provenienti da Meta AI), tre ricercatori con esperienza diretta nello sviluppo di modelli di intelligenza artificiale su larga scala. In particolare, Lample e Lacroix hanno lavorato su progetti chiave di Meta come LLaMA, contribuendo alla definizione delle architetture e delle tecniche di addestramento dei modelli generativi più avanzati, mentre Mensch ha maturato esperienza su sistemi AI complessi in DeepMind, portando competenze su scalabilità e ottimizzazione dei modelli. In pochi mesi si è affermata come uno dei principali attori europei dell’AI generativa, con l’obiettivo di offrire un’alternativa ai grandi player statunitensi puntando su apertura, efficienza e sovranità tecnologica.
La crescita è stata accompagnata da una raccolta di capitali tra le più rilevanti nel panorama europeo: l’azienda ha superato i 3 miliardi di dollari di finanziamenti complessivi e ha raggiunto una valutazione compresa tra circa 11,7 e 14 miliardi di dollari nel 2025, posizionandosi come uno dei principali campioni europei nel settore e rafforzando le proprie ambizioni globali.
Una piattaforma europea: sovranità del dato e autonomia tecnologica
Accanto alla dimensione tecnologica, Forge introduce una discontinuità strategica legata alla sua natura europea. In un mercato dominato da hyperscaler statunitensi e piattaforme centralizzate, Mistral propone un modello costruito attorno a sovranità digitale, controllo del dato e autonomia infrastrutturale.
Il primo livello riguarda la gestione dei dati. Forge è progettata per eseguire l’intero ciclo di vita dei modelli all’interno di ambienti controllati, eliminando la necessità di trasferire informazioni verso infrastrutture esterne o extra-UE. Questo risponde non solo ai requisiti del GDPR, ma anche alle crescenti criticità normative legate ai flussi internazionali di dati.
Il secondo elemento è la trasparenza tecnologica. L’approccio open-weight consente un livello di ispezionabilità superiore rispetto ai modelli chiusi, mentre la possibilità di audit interno delle pipeline si allinea con i requisiti emergenti dell’AI Act in termini di tracciabilità, explainability e gestione del rischio.
Il terzo asse è quello dell’autonomia infrastrutturale. Forge può essere eseguita su stack tecnologici scelti dall’azienda, inclusi ambienti sovrani e provider europei, senza vincoli di lock-in. In questo senso, l’europeità della piattaforma si traduce in un modello operativo: costruire e governare l’AI all’interno del proprio perimetro tecnologico.
Forge nel disegno strategico di Mistral
Il lancio di Forge si inserisce in una strategia più ampia che vede Mistral rafforzare l’intera catena del valore dell’intelligenza artificiale, dalla ricerca ai modelli, fino all’infrastruttura e agli strumenti operativi. In questo contesto rientrano anche nuove iniziative come Leanstral, agente specializzato per attività di formal verification, che evidenziano l’evoluzione verso sistemi AI sempre più autonomi e verticali.
Forge rappresenta quindi il tassello che mancava per completare questa architettura: non solo modelli e non solo API, ma una piattaforma in grado di supportare la costruzione industriale dell’intelligenza artificiale.
Il passaggio che Mistral propone è netto: dall’uso di modelli esterni alla costruzione di capacità interne. In questo scenario, l’AI non è più un servizio da consumare, ma un’infrastruttura da progettare, governare e far evolvere nel tempo.







