Anthropic lancia Claude Fable 5 e Mythos 5 tra prestazioni avanzate e sicurezza

claude 5 anthropic

Anthropic introduce Claude Fable 5 e Claude Mythos 5, due modelli che segnano un nuovo passaggio nella corsa all’intelligenza artificiale avanzata. Il primo è destinato all’uso generale, ma con salvaguardie conservative su ambiti ad alto rischio. Il secondo utilizza lo stesso modello di base, ma con alcune limitazioni rimosse per una platea ristretta di partner qualificati, in particolare nel campo della cybersecurity e, in prospettiva, della ricerca biomedica.

La scelta è significativa perché mostra con chiarezza la direzione presa dal mercato dei modelli frontier: non soltanto più capacità, contesti più lunghi, agenti più autonomi e prestazioni superiori nei benchmark, ma anche una segmentazione sempre più netta dell’accesso in base al profilo di rischio. Con Fable 5, Anthropic prova a rendere disponibile un modello di classe Mythos al pubblico generale. Con Mythos 5, invece, mantiene una corsia controllata per attività dual use, dove le stesse competenze possono accelerare difesa cyber, ricerca scientifica e sviluppo farmaceutico, ma anche aumentare il potenziale di abuso.

Claude Fable 5 porta le capacità Mythos al pubblico generale

Claude Fable 5 viene presentato come il modello più capace mai reso generalmente disponibile da Anthropic. Secondo l’azienda, le sue prestazioni superano quelle dei precedenti modelli Claude in quasi tutti i benchmark testati, con risultati particolarmente rilevanti nello sviluppo software, nel lavoro di analisi, nella visione, nella ricerca scientifica e nelle attività complesse su orizzonti lunghi.

Il punto più interessante non è soltanto il miglioramento prestazionale, ma il tipo di compiti su cui Anthropic insiste. Fable 5 sarebbe più efficace quanto più il lavoro diventa lungo, articolato e autonomo. Questo significa che il modello non è pensato solo per rispondere a singole richieste, ma per sostenere flussi complessi, con più passaggi, memoria operativa estesa e capacità di mantenere il focus su milioni di token.

È una traiettoria coerente con l’evoluzione degli agenti AI: meno chatbot conversazionale, più sistema in grado di portare avanti attività complesse, interpretare documenti, scrivere codice, correggere errori, analizzare immagini e tabelle, produrre ipotesi e aggiornare il proprio lavoro sulla base di appunti persistenti. La promessa è forte, ma apre inevitabilmente il problema centrale del lancio: più il modello è capace, più diventa necessario controllare con precisione dove e come può essere usato.

Claude Fable 5 e sicurezza AI, il compromesso tra accesso e controllo

Anthropic afferma esplicitamente che un modello di questa classe presenta rischi concreti, soprattutto in ambiti come la cybersecurity, la biologia, la chimica e la distillazione di capacità verso altri modelli. Per questo Claude Fable 5 viene distribuito con un sistema di classificatori di sicurezza che intercettano alcune richieste e spostano automaticamente la risposta su Claude Opus 4.8, il modello immediatamente meno capace.

È una scelta diversa dal semplice rifiuto. L’utente non riceve necessariamente un blocco secco, ma una risposta generata da un modello considerato più gestibile per quella categoria di richiesta. Anthropic dichiara che questi fallback si attivano in meno del 5% delle sessioni, ma ammette anche che i filtri sono stati tarati in modo conservativo e possono quindi produrre falsi positivi su richieste innocue.

Qui emerge il compromesso più delicato. Da una parte l’azienda vuole portare capacità avanzate a un pubblico ampio. Dall’altra riconosce che determinate competenze, se lasciate senza barriere, potrebbero rendere più semplici, economiche o scalabili attività dannose. Il risultato è un modello apparentemente molto potente, ma con una porzione delle sue capacità schermata da sistemi esterni di classificazione.

La distinzione tra Fable 5 e Mythos 5 nasce proprio da questo. Fable 5 è il modello per l’uso generale, con salvaguardie attive. Mythos 5 è lo stesso modello sottostante, ma con alcune protezioni rimosse in contesti controllati. Non è quindi una differenza di architettura dichiarata, ma di policy, accesso e perimetro operativo.

Software engineering, visione e knowledge work diventano il banco di prova

Sul fronte dello sviluppo software, Anthropic cita test iniziali in cui Fable 5 avrebbe compresso mesi di lavoro ingegneristico in pochi giorni. Tra gli esempi più forti c’è una migrazione codebase-wide in un repository Ruby da 50 milioni di righe, completata in un giorno rispetto ai due mesi di lavoro stimati per un team umano. È un tipo di affermazione che va letto con cautela, perché dipende molto dal contesto, dagli strumenti disponibili e dal livello di validazione successiva, ma conferma la direzione: l’AI per il coding si sta spostando dalle singole funzioni alla manutenzione su larga scala.

Anche nel lavoro di analisi Fable 5 viene descritto come un salto rispetto ai modelli precedenti. Anthropic richiama benchmark finanziari e valutazioni di partner esterni in cui il modello mostra miglioramenti nel ragionamento su documenti, nell’interpretazione di grafici e tabelle, nella ricerca fattuale, nell’analisi di causa radice e nel calcolo del valore atteso. Sono attività tipiche del lavoro knowledge-intensive, dove il vantaggio non è solo produrre testo, ma collegare fonti, numeri, contesto e inferenze.

La visione è un altro terreno chiave. Fable 5 viene presentato come nuovo stato dell’arte nei compiti multimodali, con capacità di estrarre numeri precisi da figure scientifiche dettagliate e persino ricostruire il codice sorgente di una web app partendo dagli screenshot. Anthropic cita anche un esempio dimostrativo: il completamento di Pokémon FireRed con un harness minimale basato solo sulla visione, mentre modelli precedenti richiedevano strumenti di supporto più complessi.

Il messaggio è chiaro: il modello non deve solo “vedere” immagini, ma usarle come input operativo per compiti lunghi. In prospettiva, questa è una delle aree più rilevanti per l’automazione del lavoro, perché molte attività aziendali non sono contenute in testo pulito, ma in schermate, dashboard, grafici, documenti scansionati, interfacce e materiale semi-strutturato.

Memory e long-context, il modello che lavora per periodi più lunghi

Anthropic insiste molto anche su memoria e long-context. Fable 5 sarebbe in grado di restare focalizzato attraverso milioni di token e migliorare i risultati usando i propri appunti. Nel test su Slay the Spire, l’accesso a una memoria persistente basata su file avrebbe migliorato le prestazioni del modello tre volte più che per Opus 4.8, aumentando anche la frequenza con cui il modello raggiungeva l’atto finale del gioco.

Al di là dell’esempio ludico, il punto industriale è evidente. Le imprese non chiedono solo modelli più brillanti in singola risposta, ma sistemi capaci di lavorare su progetti lunghi, ricordare decisioni, mantenere coerenza, riprendere task interrotti e ragionare su grandi basi documentali senza perdere il filo. È qui che long-context, memoria e autonomia diventano più importanti del puro punteggio in benchmark isolati.

Anthropic collega queste capacità anche a simulazioni e progettazione. Tra gli esempi citati ci sono una simulazione del sistema solare derivata da principi fisici, applicazioni su Factorio, VibeCAD e altri contesti creativi o ingegneristici. Sono demo, ma servono a posizionare Fable 5 come modello in grado di costruire, verificare e iterare, non soltanto rispondere.

Mythos 5, accesso ristretto per cybersecurity e ricerca scientifica

Claude Mythos 5 viene riservato inizialmente a un numero limitato di soggetti. L’accesso parte dai partner di Project Glasswing, iniziativa condotta in collaborazione con il governo statunitense e rivolta a cyberdefender e fornitori di infrastrutture software critiche. In questo contesto, Mythos 5 sostituisce o aggiorna Mythos Preview e offre le stesse capacità di Fable 5, ma con le salvaguardie cyber rimosse in alcune aree.

La logica è semplice: le capacità offensive o dual use che non possono essere rese disponibili liberamente possono avere valore significativo nelle mani di difensori qualificati. Un modello capace di individuare vulnerabilità, analizzare codice complesso e ragionare su catene di exploit può essere pericoloso se usato da attaccanti, ma utile per mettere in sicurezza software critico. È il classico problema dual use, qui portato a un livello molto concreto.

Anthropic afferma che Mythos 5 possiede le capacità di cybersecurity più forti di qualsiasi modello al mondo. È una dichiarazione molto ambiziosa e non neutra, ma si inserisce in un quadro in cui l’azienda sta cercando di costruire una distinzione commerciale e regolatoria: accesso generale con filtri per Fable, accesso fiduciario e controllato per Mythos.

Nel tempo, Anthropic prevede di ampliare l’accesso attraverso un trusted access program, inizialmente per organizzazioni di cybersecurity e poi anche per realtà della ricerca biomedica. Per queste ultime l’idea è offrire una versione con salvaguardie su biologia e chimica rimosse, mantenendo però attive quelle cyber.

Biologia, farmaci e genomica: il lato più sensibile del lancio

La parte più delicata del lancio riguarda la ricerca scientifica. Anthropic sostiene che Mythos 5 abbia accelerato di circa dieci volte alcuni aspetti del drug design nei test interni. In un esempio, il modello avrebbe svolto autonomamente attività tipiche di uno scienziato, dalla scelta dei siti di legame alla selezione e all’esecuzione di strumenti di progettazione proteica, fino al recupero dagli errori. Su 14 target proteici analizzati, nove avrebbero prodotto candidati promettenti per ulteriori indagini.

L’azienda attribuisce a Mythos 5 anche la capacità di generare ipotesi scientifiche nuove e convincenti in biologia molecolare. Nei confronti alla cieca con modelli Opus, i ricercatori interni avrebbero preferito le ipotesi di Mythos in circa l’80% dei casi, portandone alcune verso la valutazione sperimentale. Un’ipotesi su una proteina di E. coli sarebbe stata inoltre corroborata da uno studio indipendente condotto da un laboratorio esterno.

C’è poi il caso della genomica. Mythos 5 avrebbe condotto una ricerca largamente autonoma per oltre una settimana, assemblando dati single-cell relativi a milioni di cellule e 138 specie animali, quindi progettando e addestrando un modello di machine learning per identificare cellule con funzioni simili anche in organismi distanti. Anthropic afferma che il modello risultante avrebbe superato un modello recente pubblicato su Science, pur essendo cento volte più piccolo, con risultati che l’azienda intende pubblicare nei prossimi mesi.

Sono affermazioni di forte impatto, ma anche da verificare quando saranno disponibili pubblicazioni, metodi, dati e valutazioni indipendenti. Il dato politico-industriale resta comunque evidente: i modelli frontier stanno entrando in campi dove il confine tra accelerazione della ricerca e rischio biologico è molto più sottile rispetto al software o all’analisi documentale.

Classificatori, jailbreak e nuova retention dei dati

Le nuove salvaguardie di Fable 5 si basano su classificatori separati, cioè sistemi AI incaricati di rilevare potenziale abuso, tentativi di jailbreak e richieste in aree sensibili. Quando un contenuto viene classificato come cyber, biochimico o legato alla distillazione del modello, Fable 5 non risponde direttamente e la richiesta viene gestita da Opus 4.8.

In cybersecurity, Anthropic afferma che i classificatori coprono non solo l’exploitation in senso stretto, ma anche attività offensive più ampie, come ricognizione, discovery e movimento laterale. L’azienda dichiara di aver condotto attività di red teaming interne ed esterne, incluso un bug bounty da oltre 1.000 ore che non avrebbe trovato jailbreak universali. Al tempo stesso riconosce che impedire del tutto jailbreak universali potrebbe essere impossibile; l’obiettivo dichiarato è renderli abbastanza costosi e lenti da poterli rilevare prima di un uso su larga scala.

Per biologia e chimica la copertura viene descritta come volutamente ampia. Anthropic spiega di non essere più sicura che il blocco limitato alle sole richieste legate alle bioweapon sia sufficiente, perché i modelli più avanzati possono ormai contribuire ad attività scientifiche reali. L’esempio degli AAV, vettori usati nelle terapie geniche ma potenzialmente dual use, serve proprio a sostenere questa tesi.

La società introduce anche una nuova policy di conservazione dati per i modelli Mythos-class. Tutto il traffico su Fable 5, Mythos 5 e futuri modelli di capacità simile o superiore sarà soggetto a retention di 30 giorni, anche su superfici di prima e terza parte. Anthropic afferma che questi dati non saranno usati per addestrare nuovi modelli Claude né per finalità non legate alla sicurezza, e che l’accesso umano sarà tracciato con cancellazione dopo 30 giorni nella quasi totalità dei casi.

È un passaggio rilevante per le aziende. Da un lato la retention serve a rilevare attacchi complessi, jailbreak distribuiti e pattern di abuso. Dall’altro introduce un vincolo che alcuni clienti business dovranno valutare con attenzione, soprattutto in settori regolati o con dati altamente sensibili.

Prezzi, disponibilità e strategia commerciale

Claude Fable 5 e Claude Mythos 5 vengono offerti a 10 dollari per milione di token in input e 50 dollari per milione di token in output. Anthropic sottolinea che si tratta di meno della metà del prezzo di Claude Mythos Preview, segnalando una volontà di rendere le capacità avanzate più accessibili, almeno sul piano economico.

Fable 5 è disponibile da subito ovunque e può essere usato dagli sviluppatori tramite API con il nome claude-fable-5. Per l’accesso tramite piani in abbonamento, però, Anthropic adotta una distribuzione graduale. Fino al 22 giugno 2026 il modello è incluso senza costi aggiuntivi nei piani Pro, Max, Team ed Enterprise seat-based. Dal 23 giugno sarà rimosso da questi piani e l’utilizzo richiederà crediti, salvo eventuale estensione della finestra inclusa in base alla capacità disponibile. In seguito, l’obiettivo dichiarato è riportare Fable 5 come parte standard dei piani in abbonamento quando la capacità lo consentirà.

Questa scelta dice molto sul costo operativo dei modelli frontier. Anche quando un’azienda vuole massimizzare l’adozione, la disponibilità effettiva è condizionata da capacità computazionale, domanda e sostenibilità economica. La fase iniziale serve quindi sia a introdurre il modello sul mercato, sia a misurare carico, utilizzo e comportamento degli utenti.

Un lancio che conferma la nuova fase dell’AI frontier

Claude Fable 5 e Claude Mythos 5 rappresentano un lancio importante non solo per le prestazioni dichiarate, ma per il modello di governance che portano con sé. L’AI frontier non viene più presentata come un prodotto unico, uguale per tutti, ma come una capacità modulata da salvaguardie, accesso fiduciario, retention dei dati, programmi controllati e fallback automatici.

È una direzione probabilmente inevitabile. I modelli più avanzati stanno diventando utili in attività reali ad alto valore, dalla migrazione software alla sicurezza cyber, dall’analisi finanziaria alla biologia computazionale. Ma proprio perché sono più utili, diventano anche più rischiosi. Anthropic prova a risolvere il problema separando capacità e accesso: Fable 5 per il mercato generale, Mythos 5 per contesti autorizzati.

Resta da vedere quanto questo equilibrio reggerà alla prova dell’uso quotidiano. I falsi positivi potrebbero frustrare parte degli utenti più tecnici. I programmi trusted access dovranno dimostrare criteri trasparenti e controlli robusti. Le affermazioni scientifiche più ambiziose avranno bisogno di validazione esterna. Ma il segnale è netto: la competizione tra modelli AI non si gioca più soltanto su benchmark e prezzo per token, bensì sulla capacità di combinare prestazioni estreme, controllo del rischio e distribuzione selettiva delle funzioni più sensibili.

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato sulle novità tecnologiche

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome