Come afferma Anthropic, la società sviluppatrice dell’AI Claude, quando si realizzano applicazioni alimentate dall’intelligenza artificiale, la qualità dei prompt ha un impatto significativo sui risultati. Ma la creazione di prompt di alta qualità è impegnativa e richiede una conoscenza approfondita delle esigenze dell’applicazione e un’esperienza con modelli linguistici di grandi dimensioni. Per accelerare lo sviluppo e migliorare i risultati, Anthropic ha semplificato questo processo per rendere più facile per gli utenti produrre prompt di alta qualità.

Ora – sottolinea l’azienda – è possibile generare, testare e valutare i prompt nella Anthropic Console. Il team ha aggiunto nuove funzionalità, tra cui la possibilità di generare casi di test automatici e confrontare i risultati, che consentono di sfruttare Claude per generare le risposte migliori per le proprie esigenze.

Scrivere un ottimo prompt può essere semplice come descrivere un compito a Claude. La Console offre un generatore di prompt incorporato, alimentato da Claude 3.5 Sonnet, che permette all’utente di descrivere il task (ad esempio, “Gestisci le richieste di assistenza clienti in entrata“) e di far generare a Claude un prompt di alta qualità.

È possibile utilizzare la nuova funzione di generazione di test case di Claude per generare variabili di input per il prompt, ad esempio un messaggio di assistenza clienti in entrata, ed eseguire il prompt per vedere la risposta di Claude. In alternativa, è possibile inserire manualmente i casi di test.

Testare i prompt con una serie di input reali può aiutare gli utenti a creare fiducia nella qualità del proprio prompt prima di distribuirlo in produzione. Con la nuova funzione Evaluate gli utenti possono farlo direttamente nella Console, invece di gestire manualmente i test su fogli di calcolo o codice.

È possibile aggiungere o importare manualmente nuovi test case da un CSV, oppure chiedere a Claude di generare automaticamente i casi di test con la funzione ” Generate Test Case”. Gli utenti possono modificarli secondo le necessità, quindi eseguirli con un solo clic. Così come visualizzare e modificare la comprensione di Claude dei requisiti di generazione per ogni variabile, per ottenere un controllo più preciso sui test case generati da Claude.

L’affinamento del prompt richiede ora meno passaggi, poiché è possibile creare nuove versioni del prompt e rieseguire la suite di test per iterare e migliorare rapidamente i risultati. Anthropic ha anche aggiunto la possibilità di confrontare i risultati di due o più prompt uno accanto all’altro.

È anche possibile chiedere a esperti del settore di valutare la qualità delle risposte su una scala a 5 punti, per verificare se le modifiche apportate hanno migliorato la qualità delle risposte. Entrambe queste funzioni consentono di migliorare le prestazioni dei modelli in modo più rapido e accessibile.

Le funzioni di generazione dei casi di test e di confronto dei risultati sono disponibili per tutti gli utenti della Anthropic Console. Per saperne di più su come generare e valutare i prompt con Claude, è possibile consultate la documentazione di Anthropic.