Claude Sonnet 5 è il nuovo modello di Anthropic pensato per rendere più accessibili capacità agentiche avanzate, finora associate soprattutto ai modelli di fascia superiore. L’annuncio conferma una direzione ormai chiara nel mercato dell’intelligenza artificiale generativa: la competizione non si gioca più soltanto sulla qualità delle risposte, ma sulla capacità dei modelli di pianificare, usare strumenti, operare su ambienti complessi e completare task articolati con maggiore autonomia.
Secondo Anthropic, Claude Sonnet 5 è il modello Sonnet più agentico realizzato finora. La società lo posiziona come un’evoluzione rilevante rispetto a Sonnet 4.6, con miglioramenti in aree centrali per l’uso professionale dell’AI: ragionamento, utilizzo degli strumenti, coding, ricerca assistita, lavoro conoscitivo e capacità di eseguire attività multi-step senza fermarsi prematuramente.
Il punto industriale più interessante, però, non è solo il salto prestazionale. Anthropic presenta Sonnet 5 come un modello capace di avvicinarsi alle prestazioni di Opus 4.8, ma con costi inferiori. In altre parole, l’obiettivo è portare parte delle capacità tipiche dei modelli più potenti dentro una fascia più sostenibile per sviluppatori, imprese e utenti che fanno uso intensivo di AI agentica.
Claude Sonnet 5 nasce per l’AI agentica
Claude Sonnet 5 si inserisce in una fase in cui i modelli linguistici stanno diventando sempre meno chatbot e sempre più sistemi operativi per attività digitali complesse. La definizione di “agentico” non va intesa come semplice automazione: riguarda la capacità di formulare un piano, interagire con strumenti esterni, verificare i risultati, correggere il percorso e completare un obiettivo con un livello di supervisione umana più basso.
Anthropic sottolinea che per molti sviluppatori l’era dell’AI agentica è iniziata proprio con i modelli Sonnet. Le versioni Claude Sonnet 3.5, 3.6 e 3.7 avevano mostrato competenze rilevanti nel coding e nell’uso degli strumenti, diventando un riferimento per attività operative e di sviluppo. Negli ultimi mesi, però, i progressi più evidenti si erano concentrati sui modelli Opus, più potenti ma anche più costosi.
Con Claude Sonnet 5, Anthropic prova a ridurre questo divario. Il modello viene descritto come vicino a Opus 4.8 su diversi scenari, pur rimanendo nella fascia Sonnet. Questo posizionamento è rilevante per tutte le aziende che stanno sperimentando agenti AI in produzione, perché la sostenibilità economica resta uno dei principali vincoli all’adozione su larga scala.
Claude Sonnet 5 migliora ragionamento, coding e uso degli strumenti
Il miglioramento rispetto a Sonnet 4.6 riguarda soprattutto le capacità operative. Anthropic cita progressi nel ragionamento, nell’uso degli strumenti, nel coding e nel cosiddetto knowledge work, cioè quelle attività basate sull’elaborazione di informazioni, documenti, ambienti software e processi decisionali.
La società evidenzia anche un comportamento più affidabile nei task complessi. I partner in early access avrebbero osservato una maggiore capacità di completare lavori che i precedenti modelli Sonnet tendevano a interrompere prima della conclusione. Un altro aspetto segnalato riguarda la verifica autonoma dell’output: Sonnet 5 sarebbe più propenso a controllare il proprio lavoro senza che l’utente debba esplicitamente richiederlo.
Questo elemento è tutt’altro che secondario. Nei flussi enterprise, un agente AI che produce output senza validazione aumenta il carico di controllo umano. Un modello che, invece, tende a rivedere il risultato e a intercettare errori riduce parte dell’attrito operativo. Non elimina la necessità di supervisione, ma rende più realistico l’impiego dell’AI in attività prolungate e non puramente conversazionali.
Il confronto con Opus 4.8 e Sonnet 4.6
Anthropic presenta Claude Sonnet 5 come un modello nettamente superiore a Sonnet 4.6 e più vicino a Opus 4.8. Il confronto viene articolato attraverso benchmark ed evaluation dedicate alle capacità agentiche, tra cui BrowseComp per la ricerca agentica e OSWorld-Verified per l’uso del computer.
Secondo l’azienda, Sonnet 5 rappresenta un miglioramento rigoroso rispetto a Sonnet 4.6 e offre una gamma più ampia di opzioni nel rapporto tra costo e prestazioni. A livelli di effort medi, il modello sarebbe più efficiente; a livelli di effort più elevati, potrebbe arrivare a eguagliare Opus 4.8 in alcuni task.
Il riferimento all’effort è centrale nella strategia di Anthropic. L’utente può modulare il livello di impegno computazionale del modello in base al tipo di attività. Per un compito semplice può bastare un effort contenuto, mentre un task complesso può richiedere una configurazione più spinta. Questa granularità consente di bilanciare prestazioni e costi, un aspetto particolarmente importante per sviluppatori e aziende che devono stimare budget, latenza e consumi token.
Prezzi più bassi per portare gli agenti AI in produzione
Claude Sonnet 5 viene lanciato con un prezzo introduttivo di 2 dollari per milione di token in input e 10 dollari per milione di token in output, valido fino al 31 agosto 2026. Successivamente, il prezzo standard passerà a 3 dollari per milione di token in input e 15 dollari per milione di token in output.
Il confronto interno con Opus 4.8 è significativo: il modello Opus viene indicato a 5 dollari per milione di token in input e 25 dollari per milione di token in output. La differenza economica rafforza il posizionamento di Sonnet 5 come modello adatto a scenari dove serve una capacità agentica elevata, ma senza il costo pieno della fascia Opus.
Anthropic segnala anche un cambiamento nel tokenizer. Claude Sonnet 5 usa un tokenizer aggiornato che può modificare il modo in cui il testo viene convertito in token. La stessa quantità di input può quindi corrispondere a un numero superiore di token, indicativamente tra 1,0 e 1,35 volte a seconda del contenuto. Il prezzo introduttivo è stato impostato proprio per rendere la transizione verso il nuovo modello sostanzialmente neutra sul piano dei costi.
Disponibilità su Claude, Claude Code e API
Claude Sonnet 5 è disponibile su tutti i piani. Diventa il modello predefinito per gli utenti Free e Pro, mentre è disponibile anche per gli utenti Max, Team ed Enterprise. Il modello arriva inoltre su Claude Code e sulla Claude Platform, dove può essere utilizzato tramite API con il nome claude-sonnet-5.
La disponibilità trasversale è un segnale preciso. Anthropic non sta trattando Sonnet 5 come un modello sperimentale o riservato a una nicchia di sviluppatori, ma come nuovo riferimento operativo della famiglia Sonnet. Questo può avere effetti importanti sull’adozione, perché porta capacità agentiche più avanzate anche dentro piani consumer e professionali meno costosi.
L’integrazione con Claude Code è particolarmente rilevante. Gli strumenti di sviluppo assistito dall’AI stanno diventando uno dei terreni più competitivi del settore, con modelli chiamati non solo a scrivere codice, ma a leggere repository, pianificare modifiche, eseguire comandi, interpretare errori e completare task software in modo sempre più autonomo.
Sicurezza: meno comportamenti indesiderati rispetto a Sonnet 4.6
Anthropic insiste anche sul profilo di sicurezza. Le valutazioni pre-deployment avrebbero mostrato un miglioramento complessivo rispetto a Sonnet 4.6. Il modello sarebbe più efficace nel rifiutare richieste malevole e nel resistere a tentativi di hijacking tramite prompt injection, un aspetto cruciale per gli agenti AI che accedono a strumenti, browser, terminali o dati aziendali.
La società afferma inoltre che Claude Sonnet 5 mostra tassi inferiori di allucinazione e sycophancy rispetto a Sonnet 4.6. Quest’ultimo punto è importante perché la compiacenza del modello verso l’utente può diventare un problema concreto nei contesti decisionali: un assistente che tende a confermare ipotesi sbagliate o a compiacere il richiedente è meno affidabile, soprattutto quando lavora su documenti, analisi tecniche o processi aziendali.
Nel behavioral audit automatizzato di Anthropic, che valuta diverse forme di comportamento non desiderabile, Sonnet 5 ottiene risultati migliori rispetto al predecessore. Tuttavia, il modello mostra ancora tassi più elevati di comportamento disallineato rispetto a sistemi più potenti come Opus 4.8 e Claude Mythos Preview. In sostanza, il messaggio è duplice: Sonnet 5 migliora la sicurezza della famiglia Sonnet, ma non diventa automaticamente il modello più sicuro dell’intero portafoglio Claude.
Cybersecurity: capacità inferiori agli Opus, ma safeguard attivi
Uno dei passaggi più delicati dell’annuncio riguarda la cybersecurity. Anthropic dichiara di non aver addestrato deliberatamente Claude Sonnet 5 su attività cyber. Il modello può svolgere alcuni compiti ordinari e non dannosi, ma nelle valutazioni relative a competenze potenzialmente pericolose, come lo sviluppo di exploit software, resta molto sotto modelli più potenti come Opus 4.8 e Mythos 5.
Nel test citato da Anthropic, realizzato in collaborazione con Mozilla su vulnerabilità di Firefox 147 poi corrette in Firefox 148, Sonnet 5 non è mai riuscito a sviluppare un exploit pienamente funzionante. Ha però mostrato una percentuale leggermente superiore di successo parziale rispetto a Sonnet 4.6. Secondo Anthropic, questo aumento deriverebbe dal miglioramento generale dell’intelligenza del modello, non da un addestramento specifico su compiti cyber offensivi.
Nonostante il rischio complessivo venga giudicato basso, Anthropic ha comunque lanciato Sonnet 5 con cyber safeguard attivi di default. Questi sistemi rilevano e bloccano in tempo reale utilizzi cyber pericolosi. Sono gli stessi safeguard presenti in Claude Opus 4.7 e 4.8, ma meno restrittivi rispetto a quelli introdotti con Fable 5, modello per il quale l’azienda ha adottato blocchi più estesi su una gamma più ampia di attività cyber.
Una mossa per rendere sostenibile l’AI agentica
Claude Sonnet 5 va letto come un tassello nella normalizzazione dell’AI agentica. Anthropic non sta semplicemente aumentando le prestazioni di un modello intermedio: sta cercando di spostare verso il basso, in termini di costo e disponibilità, capacità che fino a poco tempo fa richiedevano modelli più grandi e costosi.
Il beneficio potenziale per le imprese è evidente. Un modello più economico ma sufficientemente capace può essere impiegato in volumi maggiori, su workflow più estesi e in scenari dove l’uso continuo di un modello top di gamma sarebbe difficile da giustificare. Questo vale per il coding, per la ricerca assistita, per l’automazione documentale, per l’orchestrazione di strumenti e per i primi agenti verticali integrati nei processi aziendali.
Resta però il tema della governance. Più un modello è agentico, più diventa importante controllare permessi, accessi, strumenti disponibili, memoria, dati trattati e policy di esecuzione. Il miglioramento delle capacità non riduce automaticamente il rischio operativo: lo sposta su un piano diverso. L’adozione di modelli come Claude Sonnet 5 richiede quindi architetture di controllo più mature, non solo entusiasmo per benchmark migliori.
Claude Sonnet 5 rafforza la pressione competitiva sul mercato AI
L’arrivo di Claude Sonnet 5 aumenta la pressione competitiva nella fascia dei modelli ad alte prestazioni ma a costo relativamente contenuto. È una fascia strategica, perché intercetta la domanda più concreta: non il singolo esperimento dimostrativo, ma l’uso quotidiano e ripetuto dell’AI in azienda.
Il messaggio di Anthropic è netto: Sonnet non è più soltanto l’alternativa più economica a Opus, ma una piattaforma sufficientemente forte per molti scenari agentici avanzati. Se le prestazioni dichiarate saranno confermate nell’uso reale, Claude Sonnet 5 potrebbe diventare uno dei modelli più rilevanti per chi sviluppa applicazioni AI con tool use, coding autonomo, browser agentici e workflow multi-step.
La partita, tuttavia, non si chiude sui benchmark. Il valore effettivo dipenderà dalla stabilità del modello, dalla qualità dell’integrazione con gli strumenti, dalla gestione dei costi reali dopo il cambio di tokenizer, dalla robustezza contro prompt injection e dall’affidabilità in contesti lunghi e complessi. Sono questi i parametri che separano un buon modello dimostrativo da un’infrastruttura utilizzabile in produzione.
Con Claude Sonnet 5, Anthropic punta chiaramente alla seconda categoria.






