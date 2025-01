DeepSeek, la startup cinese di intelligenza artificiale che sta causando un mezzo terremoto nel mercato dell’AI, con la sua app che ha superato ChatGPT negli app store di diversi Paesi, ha rilasciato in open source il suo modello di ragionamento R1.

Secondo l’azienda, il reasoning model DeepSeek-R1 offre prestazioni pari a quelle di OpenAI-o1 e ha il vantaggio che il modello e il report tecnico sono completamente open-source, rilasciati con licenza MIT, e che è possibile distillare e commercializzare liberamente il modello stesso.

L’azienda ha attivato sia il sito web che l’API sulla propria piattaforma, per consentire agli utenti di provare DeepThink.

L’azienda ha reso disponibili 6 modelli più compatti e pienamente open-source distillati da DeepSeek-R1, e secondo il team i modelli 32B e 70B offrono una performance paragonabile a quella di OpenAI-o1-mini. Con questi rilasci, DeepSeek intende spingere oltre i confini dell’AI aperta.

In particolare, l’azienda sottolinea un incremento significativo delle prestazioni con dati etichettati minimi, e prestazioni alla pari con OpenAI-o1 in task di matematica, codice e ragionamento.

Riguardo a quest’ultimo punto, del ragionamento, prima di fornire la risposta finale il modello genera una catena di pensieri (Chain of Thought, CoT) per migliorare l’accuratezza delle sue risposte. L’API di DeepSeek fornisce agli utenti l’accesso al contenuto della CoT generato dal modello, consentendo loro di vederlo, mostrarlo e distillarlo.

Maggiori informazioni sul modello sono disponibili nel report tecnico.

Il settore sembra al momento considerare in modo positivo l’offerta dell’azienda cinese. Pat Gelsinger, l’ex CEO di Intel, ha espresso in prima persona il suo apprezzamento per DeepSeek, in un post su X.

Pat Gelsinger ha inoltre dichiarato alla testata TechCrunch che gli ingegneri della sua stessa startup, Gloo, stanno utilizzando il modello R1. Secondo Gelsinger, il fatto di rendere l’AI più accessibile permetterà all’intelligenza artificiale di diffondersi molto di più.

D’altra parte, c’è da dire che non tutti hanno accolto DeepSeek con lo stesso entusiasmo, e molti hanno invece espresso dei dubbi sulla effettiva performance in relazione ai costi e alle risorse di training e inferenza, nonché sulla trasparenza dei modelli.

Un fatto è certo: l’avvento improvviso sulla scena dell’intelligenza artificiale di una finora semi-sconosciuta startup cinese sta suscitando tanto clamore, e anche una certa preoccupazione tra gli investitori e le big-tech americane.

L’app dell’assistente AI DeepSeek ha superato con un poderoso balzo ChatGPT ponendosi in cima alla classifica di download dell’App Store negli Stati Uniti, e ora è prima anche in Italia. Ma la cosa che preoccupa il gotha dell’AI statunitense è un’altra.

Alla base del chatbot che alimenta l’assistente AI, c’è il modello DeepSeek-V3 con oltre 600B parametri che l’azienda sviluppatrice – evidentemente abbastanza a ragione – definisce rivoluzionario. Infatti, questa tecnologia AI all’avanguardia sembra in grado di competere con i migliori modelli internazionali su diversi benchmark prestazionali, offrendo velocità paragonabili e in alcuni casi superiori, e funzionalità dello stesso livello.

In più – e questo è l’aspetto più sorprendente – il team afferma che, nonostante le sue eccellenti prestazioni, DeepSeek-V3 richiede risorse non eccessive (rispetto agli standard di questo settore) per il training, e il suo processo di addestramento è molto stabile. A preoccupare gli altri player è quindi che una startup sia riuscita, con risorse finanziarie e tecnologiche verosimilmente molto inferiori ai colossi del settore, a raggiungere prestazioni analoghe se non migliori. E in un tempo relativamente breve. E inoltre, che sia riuscita a sviluppare modelli che richiedono meno risorse anche per l’inferenza, in proporzione alle capacità, risultando così adatti per una forte espansione delle soluzioni AI.

Queste considerazioni hanno portato ad esempio Marc Andreessen – da anni protagonista del settore tecnologico, uno dei fondatori di Netscape Communications e attualmente venture capitalist esperto in nuove tecnologie –, a definire “Deepseek R1 il momento Sputnik dell’intelligenza artificiale”, con riferimento al primo satellite artificiale mandato in orbita con successo dall’allora Unione Sovietica, che suscitò grande clamore mediatico soprattutto negli Stati Uniti e che segnò l’inizio della corsa allo spazio.

Molti osservatori hanno ripreso l’espressione di Marc Andreessen per sottolineare come gli Stati Uniti e le big tech statunitensi, in un periodo di grandi investimenti e ampie iniziative per l’innovazione dell’intelligenza artificiale, vedono ora emergere una concorrenza cinese forse altrettanto all’avanguardia, e senza la necessità di grandiosi investimenti, che probabilmente non si aspettavano.

Se si dimostrasse vero che DeepSeek-V3 e DeepSeek-R1 offrono prestazioni alla pari con i modelli di OpenAI, Meta, Google e Anthropic, per citare alcuni dei principali player del settore, e che tali risultati sono ottenuti con inferiori risorse sia finanziare che tecnologiche, e sia nel training che nell’esecuzione, allora il rapporto di forze nello stato dell’arte dell’AI tra gli Stati Uniti e la Cina potrebbe addirittura capovolgersi, o in ogni caso sarebbe molto più equilibrato.

Ma, come dicevamo, non tutti sono di questo parere e anzi molti ritengono che si tratti di un allarme sproporzionato. Altri pensano invece che, anche se la minaccia fosse fondata, essa potrebbe essere colta come sfida per un’ulteriore accelerazione anche da parte delle big tech americane. Proprio come il “momento Sputnik”, stavolta non per una corsa allo spazio, bensì per una corsa all’AI.