Alibaba ha annunciato il lancio di Qwen3, l’ultima generazione della sua famiglia di modelli linguistici di grandi dimensioni (LLM) open-source, che secondo l’azienda cinese stabilisce un nuovo punto di riferimento per l’innovazione dell’intelligenza artificiale.
La serie Qwen3 – spiega Alibaba – presenta sei modelli densi e due modelli Mixture-of-Experts (MoE), offrendo agli sviluppatori la flessibilità necessaria per realizzare applicazioni di nuova generazione per dispositivi mobili, occhiali smart, veicoli autonomi, robotica e altro ancora.
Tutti i modelli Qwen3 – compresi i modelli densi (parametri 0,6B, 1,7B, 4B, 8B, 14B e 32B) e i modelli MoE (30B con 3B attivi e 235B con 22B attivi) – sono ora open source e disponibili a livello globale.
L’azienda sottolinea che Qwen3 segna il debutto dei modelli di ragionamento ibridi di Alibaba, che combinano le tradizionali funzionalità LLM con un ragionamento avanzato e dinamico. I modelli Qwen3 possono passare senza soluzione di continuità dalla modalità di ragionamento per compiti complessi e in più fasi, come la matematica, il coding e la deduzione logica, alla modalità di non ragionamento per risposte veloci e generiche.
Per gli sviluppatori che accedono a Qwen3 tramite API, il modello offre un controllo granulare sulla durata del ragionamento (fino a 38K token), consentendo un equilibrio ottimizzato tra prestazioni intelligenti ed efficienza di calcolo. In particolare, il modello Qwen3-235B-A22B MoE riduce significativamente i costi di implementazione rispetto ad altri modelli all’avanguardia, sostiene l’azienda, rafforzando l’impegno di Alibaba per un’intelligenza artificiale accessibile e ad alte prestazioni.
Addestrato su un enorme set di dati di 36 trilioni di token – il doppio rispetto al suo predecessore Qwen2.5 – Qwen3 offre progressi significativi nel ragionamento, nel seguire le istruzioni, nell’uso degli strumenti e nei compiti multilingue.
Le principali funzionalità includono:
- Padronanza multilingue: supporta 119 lingue e dialetti, con prestazioni allo stato dell’arte nella traduzione e nell’instruction-following multilingue.
- Integrazione avanzata degli agenti: Supporta in modo nativo il Model Context Protocol (MCP) e un robusto function-calling, all’avanguardia nei modelli open-source in compiti complessi basati su agenti.
- Ragionamento superiore: Supera i precedenti modelli Qwen (QwQ in modalità thinking e Qwen2.5 in modalità non-thinking) in matematica, coding e ragionamento logico.
- Allineamento umano migliorato: Offre esperienze più naturali di scrittura creativa, gioco di ruolo e dialogo a più turni per conversazioni più naturali e coinvolgenti.
Alibaba spiega che, grazie ai progressi nell’architettura dei modelli, all’aumento dei dati di addestramento e a metodi di addestramento più efficaci, i modelli Qwen3 ottengono risultati di livello molto alto in benchmark di settore come AIME25 (ragionamento matematico), LiveCodeBench (competenza nel codice), BFCL (capacità di richiamare strumenti e funzioni) e Arena-Hard (benchmark per LLM instruction-tuned).
Inoltre, per sviluppare il modello di ragionamento ibrido, è stato implementato un processo di addestramento articolato in quattro fasi, che include un cold start su una lunga catena di pensiero (CoT, chain-of-thought), l’apprendimento per rinforzo (RL) basato sul ragionamento, la fusione delle modalità di pensiero e l’apprendimento per rinforzo generale.
I modelli Qwen3 sono ora disponibili per il download su Hugging Face, Github e ModelScope e possono essere esplorati su chat.qwen.ai. L’accesso alle API sarà presto disponibile attraverso la piattaforma di sviluppo di modelli AI Model Studio di Alibaba. Qwen3 alimenta anche l’applicazione di punta di Alibaba, il super assistente AI Quark.
Dal suo debutto – sottolinea Alibaba –, la famiglia di modelli Qwen ha attirato oltre 300 milioni di download in tutto il mondo. Gli sviluppatori hanno creato più di 100.000 modelli derivati basati su Qwen su Hugging Face, rendendo Qwen una delle serie di modelli AI open-source più adottate al mondo.









