Claude insights and observations, o “Clio”, è il tentativo di Anthropic di rispondere alla domanda su come si possa ricercare e osservare come vengono utilizzati i sistemi AI mantenendo rigorosamente la privacy degli utenti.

La premessa da cui parte Anthropic è per l’appunto la domanda: per cosa si usano i modelli di intelligenza artificiale? Nonostante la popolarità in rapida crescita dei modelli linguistici di grandi dimensioni, finora – sottolinea l’azienda – ci sono poche informazioni su come vengono utilizzati.

Non si tratta solo di curiosità o di ricerca sociologica, puntualizza Anthropic. Sapere come le persone utilizzano effettivamente i modelli linguistici è importante per ragioni di sicurezza: i provider compiono sforzi considerevoli nei test pre-deployment e utilizzano sistemi di Trust and Safety per prevenire gli abusi. Ma la vastità e la diversità di ciò che i modelli linguistici possono fare rende molto difficile la comprensione dei loro usi, per non parlare di qualsiasi tipo di monitoraggio completo della sicurezza.

C’è anche un fattore cruciale che ostacola una chiara comprensione dell’uso dei modelli di intelligenza artificiale: la privacy. In Anthropic, spiega l’azienda, i modelli Claude non vengono addestrati di default sulle conversazioni degli utenti e viene presa molto sul serio la protezione dei dati degli utenti. Il team si è dunque chiesto come poter ricercare e osservare come vengono utilizzati i sistemi di Anthropic preservando rigorosamente la privacy degli utenti?

Clio è uno strumento di analisi automatizzato che consente di analizzare, nel rispetto della privacy, l’uso del modello linguistico nel mondo reale. Fornisce informazioni sugli usi quotidiani di claude.ai in modo analogo a strumenti come Google Trends. Inoltre, sta già aiutando a migliorare le misure di sicurezza di Anthropic, sottolinea l’azienda. In un post sul blog ufficiale dell’azienda, che accompagna un paper di ricerca completo, Anthropic descrive Clio e alcuni dei suoi risultati iniziali.

Gli approcci tradizionali alla sicurezza di tipo top-down (come le valutazioni e il red teaming) si basano sulla conoscenza di ciò che si deve cercare in anticipo. Clio adotta un approccio diverso, consentendo la scoperta di pattern bottom-up, distillando le conversazioni in cluster di argomenti astratti e comprensibili. Ciò avviene preservando la privacy degli utenti: i dati vengono automaticamente anonimizzati e aggregati, e solo i cluster di livello superiore sono visibili agli analisti umani.

In sintesi, il processo a più fasi di Clio:

Estrazione dei “facet” : Per ogni conversazione, Clio estrae più “facet”, ovvero attributi o metadati specifici come l’argomento della conversazione, il numero di turni di conversazione o la lingua utilizzata.

: Per ogni conversazione, Clio estrae più “facet”, ovvero attributi o specifici come l’argomento della conversazione, il numero di turni di conversazione o la lingua utilizzata. Clustering semantico : Le conversazioni simili vengono raggruppate automaticamente per tema o argomento generale.

: Le conversazioni simili vengono raggruppate automaticamente per tema o argomento generale. Descrizione del cluster : Ogni cluster riceve un titolo e un riassunto descrittivo che cattura i temi comuni dai dati grezzi, escludendo le informazioni private.

: Ogni cluster riceve un titolo e un riassunto descrittivo che cattura i temi comuni dai dati grezzi, escludendo le informazioni private. Costruzione di gerarchie: I cluster vengono organizzati in una gerarchia a più livelli per facilitare l’esplorazione. Possono poi essere presentati in un’interfaccia interattiva che gli analisti di Anthropic possono utilizzare per esplorare i modelli attraverso diverse dimensioni (argomento, lingua, ecc.).

Queste quattro fasi sono interamente gestite da Claude, non da analisti umani. Questo fa parte del progetto di Clio di Anthropic, orientato alla privacy, con più livelli per creare una “difesa in profondità”. Ad esempio, Claude è istruito a estrarre le informazioni rilevanti dalle conversazioni omettendo i dettagli privati. C’è anche una soglia minima per il numero di utenti unici o di conversazioni, in modo che gli argomenti a bassa frequenza (che potrebbero essere specifici per le persone) non vengano inavvertitamente esposti. Come controllo finale, Claude verifica che i riassunti dei cluster non contengano informazioni troppo specifiche o identificative prima di mostrarli all’utente umano.

Il team di Anthropic ha utilizzato Clio per analizzare 1 milione di conversazioni con Claude su claude.ai (sia nel livello Free che in quello Pro) per identificare i task principali per cui le persone utilizzano Claude. Questo ha rivelato una particolare enfasi sulle attività legate al coding: la categoria “Sviluppo di applicazioni web e mobile” ha rappresentato oltre il 10% di tutte le conversazioni. Gli sviluppatori di software utilizzano Claude per compiti che vanno dal debug del codice alla spiegazione delle operazioni e dei concetti di Git.

Gli utilizzi didattici costituiscono un’altra categoria significativa, con oltre il 7% delle conversazioni incentrate sull’insegnamento e l’apprendimento. Una percentuale consistente di conversazioni (quasi il 6%) riguardava la strategia e l’operatività aziendale (compresi compiti come la redazione di comunicazioni professionali e l’analisi di dati aziendali).

Clio ha anche identificato migliaia di cluster di conversazioni più piccoli, che mostrano la ricca varietà di usi di Claude. Alcuni di questi sono forse sorprendenti, tra cui: Interpretazione dei sogni; Analisi delle partite di calcio; Preparazione alle catastrofi; “Suggerimenti” per i cruciverba; Gioco di Dungeons & Dragons; Contare le r nella parola “strawberry”.

Inoltre, l’uso di Claude varia notevolmente da una lingua all’altra, riflettendo contesti culturali ed esigenze diverse. Anthropic ha calcolato un tasso di base della frequenza con cui ogni lingua compare nelle conversazioni in generale, e da lì ha potuto identificare gli argomenti in cui una determinata lingua compare molto più frequentemente del solito.

Anthropic ha anche condiviso interessanti dettagli su come l’azienda migliora i suoi sistemi di sicurezza con Clio.

Per ulteriori informazioni, è possibile consultare il blog di Anthropic.