OpenAI ha annunciato ieri sera di stare iniziando a distribuire la versione alpha del nuovo advanced Voice Mode a un piccolo gruppo di persone in ChatGPT Plus.

Feature: Advanced Voice Mode offre conversazioni più naturali e in tempo reale, consente di interrompere in qualsiasi momento e percepisce e risponde alle emozioni dell’utente.

Disponibilità: Nelle prossime settimane OpenAI espanderà gradualmente l’accesso a più utenti Plus e prevede di estendere questa funzionalità a tutti gli utenti Plus in autunno. Le persone in versione alpha vedranno un avviso nell’app ChatGPT e un’e-mail con le istruzioni su come utilizzarla. Come accennato in precedenza, la condivisione di video e schermo non farà parte della versione alpha, ma verrà lanciata in un secondo momento.

Dall’anteprima di GPT-4o voice a maggio, la massima priorità di OpenAI è stata garantire la qualità e la sicurezza delle conversazioni vocali GPT-4o in modo da poter offrire questa esperienza a tutti coloro che utilizzano ChatGPT.

Qualità: Per offrire la migliore esperienza possibile ai propri utenti, OpenAI ha rafforzato la capacità del modello di supportare milioni di conversazioni vocali simultanee in tempo reale mantenendo bassa latenza e alta qualità.

Sicurezza: A giugno OpenAI ha comunicato che stava lavorando per migliorare la capacità del modello di rilevare e rifiutare determinati contenuti. Negli ultimi due mesi, ha testato le capacità vocali del modello con più di 100 red teamer esterni, che collettivamente parlano un totale di 45 lingue diverse e rappresentano 29 aree geografiche diverse. Sulla base del loro feedback e dei propri test di sicurezza interni, alcune delle cose che OpenAI ha fatto includono:

Per garantire che il proprio sistema rispetti la privacy delle persone, Advanced Voice Mode utilizzerà le quattro voci preimpostate che OpenAI ha creato in collaborazione con doppiatori. OpenAI ha fatto in modo che ChatGPT non possa impersonare le voci di altre persone, sia individui, che personaggi pubblici, e bloccherà gli output che differiscono da una di queste voci preimpostate.

Per garantire che il proprio sistema rispetti i diritti degli autori, OpenAI ha aggiunto nuovi filtri che riconosceranno e bloccheranno determinate richieste di generare musica o altro audio protetto da copyright.

Per garantire che ChatGPT sia il più utile e collaborativo possibile, OpenAI ha applicato le stesse tecniche di sicurezza alle modalità di testo e vocali, inclusa la garanzia che GPT-4o sia conforme alle leggi applicabili e non generi contenuti dannosi.

We’re starting to roll out advanced Voice Mode to a small group of ChatGPT Plus users. Advanced Voice Mode offers more natural, real-time conversations, allows you to interrupt anytime, and senses and responds to your emotions. pic.twitter.com/64O94EhhXK — OpenAI (@OpenAI) July 30, 2024

OpenAI ha in programma di condividere un rapporto dettagliato sul lavoro che ha svolto per rendere l’esperienza dell’Advanced Voice Mode più sicura e divertente per tutti all’inizio di agosto.

Questa fase alpha riguarda test, apprendimento e perfezionamento per offrire la migliore esperienza possibile. Con il lancio graduale, OpenAI può monitorare da vicino l’utilizzo e migliorare continuamente le capacità e la sicurezza del modello sulla base del feedback del mondo reale.

