L’intelligenza artificiale sta assumendo un ruolo sempre più centrale nella sicurezza informatica, non solo come strumento di difesa ma anche come acceleratore della scoperta di vulnerabilità software. Un esempio concreto arriva dalla collaborazione tra Anthropic e Mozilla: il modello Claude Opus 4.6 è stato utilizzato per analizzare il codice di Firefox e ha individuato in poche settimane numerose vulnerabilità, dimostrando come l’AI possa diventare un nuovo tipo di “ricercatore di sicurezza” automatizzato.
Nel corso di due settimane di lavoro con i ricercatori Mozilla, Claude Opus 4.6 ha identificato 22 vulnerabilità nel browser Firefox. Di queste, 14 sono state classificate come vulnerabilità ad alta gravità, pari a circa un quinto di tutte quelle corrette nel browser nel corso del 2025. Il risultato suggerisce un cambiamento significativo: strumenti di AI avanzata possono accelerare in modo rilevante il processo di individuazione delle falle di sicurezza nei software complessi.
AI e sicurezza informatica: l’analisi del codice diventa automatizzata
Il progetto nasce inizialmente come attività di valutazione tecnica delle capacità del modello. I ricercatori avevano osservato che una versione precedente del modello Claude era ormai vicina a risolvere completamente i test di CyberGym, un benchmark progettato per verificare se i modelli linguistici siano in grado di riprodurre vulnerabilità informatiche già note.
Per rendere la valutazione più realistica, è stato scelto Firefox come caso di studio. Il browser open source rappresenta infatti uno dei progetti software più complessi e più analizzati dal punto di vista della sicurezza. Centinaia di milioni di utenti lo utilizzano ogni giorno, e qualsiasi vulnerabilità può avere implicazioni potenzialmente molto serie.
Il primo passo è stato chiedere al modello di individuare vulnerabilità già documentate in versioni precedenti del codice. Claude Opus 4.6 è riuscito a riprodurre una percentuale molto elevata di vulnerabilità storiche, molte delle quali avevano richiesto mesi di lavoro da parte di ricercatori umani per essere scoperte.
Il vero test, tuttavia, è arrivato quando al modello è stato chiesto di trovare vulnerabilità nuove nella versione attuale del browser, cioè problemi che non erano mai stati segnalati prima.
In venti minuti individuata una vulnerabilità critica
Durante l’analisi del motore JavaScript di Firefox — una componente particolarmente sensibile perché elabora codice proveniente da siti web non affidabili — il modello ha individuato dopo appena venti minuti una vulnerabilità di tipo “Use After Free”. Si tratta di un problema di gestione della memoria che può consentire a un attaccante di sovrascrivere dati e potenzialmente eseguire codice malevolo.
La vulnerabilità è stata verificata da ricercatori umani in un ambiente virtuale indipendente e successivamente segnalata attraverso Bugzilla, il sistema di gestione delle vulnerabilità utilizzato dal progetto Firefox. Nel tempo necessario per completare questa prima segnalazione, il modello aveva già individuato decine di altri casi di crash potenzialmente rilevanti per la sicurezza.
Alla fine dell’analisi, il sistema aveva esaminato quasi 6.000 file C++ del codice di Firefox e prodotto 112 segnalazioni distinte di bug, molte delle quali poi confermate e corrette nelle versioni successive del browser.

L’AI trova le vulnerabilità molto meglio di quanto riesca a sfruttarle
Un aspetto importante emerso dall’esperimento riguarda la capacità dell’AI non solo di individuare vulnerabilità ma anche di sfruttarle, cioè trasformarle in veri exploit.
Per testare questo scenario, i ricercatori hanno chiesto al modello di sviluppare codice di attacco in grado di sfruttare le vulnerabilità individuate. L’obiettivo era dimostrare un attacco reale, ad esempio leggendo e scrivendo file nel sistema bersaglio.
Nonostante centinaia di tentativi e circa 4.000 dollari di crediti API utilizzati per l’esperimento, il modello è riuscito a produrre exploit funzionanti soltanto in due casi. Questo suggerisce che oggi l’AI è molto più efficace nel ruolo di “cacciatore di bug” che non in quello di sviluppatore di attacchi.
Un vantaggio importante per i difensori: individuare le vulnerabilità è significativamente più economico e veloce rispetto allo sviluppo di exploit funzionanti.
Verso una nuova generazione di strumenti di sicurezza basati su AI
Dall’esperimento emerge anche un nuovo paradigma operativo per la cybersecurity: l’uso di agenti AI capaci di analizzare codice, individuare vulnerabilità e persino proporre automaticamente patch di correzione.
Uno degli elementi chiave identificati dai ricercatori è l’utilizzo di strumenti di verifica automatica, chiamati “task verifier”. Questi sistemi permettono all’agente AI di controllare in tempo reale se la patch generata elimina effettivamente la vulnerabilità senza introdurre regressioni nel software.
Secondo i ricercatori, questa combinazione tra AI e strumenti di verifica potrebbe accelerare significativamente il processo di correzione dei bug, riducendo il tempo che intercorre tra la scoperta di una vulnerabilità e il rilascio della patch.
La finestra di vantaggio per i difensori potrebbe essere temporanea
I risultati ottenuti indicano che i modelli AI di nuova generazione stanno diventando ricercatori di vulnerabilità di livello mondiale. Oltre ai problemi individuati in Firefox, il modello è stato utilizzato anche per identificare vulnerabilità in altri progetti critici, come il kernel Linux.
Per il momento, la capacità dell’AI di individuare e correggere vulnerabilità sembra superare quella di sviluppare exploit completi. Questo offre un vantaggio strategico ai difensori, che possono utilizzare l’AI per rafforzare la sicurezza dei sistemi prima che gli attaccanti sfruttino le stesse tecnologie.
Tuttavia, la velocità di evoluzione dei modelli suggerisce che questo equilibrio potrebbe non durare a lungo. Se in futuro i modelli AI diventeranno altrettanto efficaci nello sviluppo di exploit quanto lo sono oggi nella scoperta di vulnerabilità, sarà necessario introdurre nuove misure di sicurezza e nuovi meccanismi di controllo per prevenire usi malevoli di queste tecnologie.






