Amazon ha annunciato Amazon Nova Sonic, un nuovo foundation model che riunisce la comprensione e la generazione del parlato in un unico modello, per consentire conversazioni vocali più simili a quelle umane nelle applicazioni AI.
Disponibile tramite una nuova API in Amazon Bedrock, il modello semplifica lo sviluppo di applicazioni vocali, come l’automazione delle chiamate al servizio clienti e gli agenti AI in un’ampia gamma di settori, tra cui viaggi, istruzione, assistenza sanitaria, intrattenimento e altro.
Gli approcci tradizionali alla costruzione di applicazioni abilitate alla voce – spiega Amazon – prevedono una complessa orchestrazione di più modelli, come il riconoscimento vocale per convertire il parlato in testo, i modelli linguistici di grandi dimensioni (LLM) per comprendere e generare risposte e il text-to-speech per convertire il testo in audio.
Questo approccio frammentato non solo aumenta la complessità dello sviluppo, ma non riesce a preservare il contesto acustico cruciale e le sfumature come il tono, la prosodia e lo stile del parlato, essenziali per le conversazioni naturali.
Nova Sonic di Amazon adotta un nuovo approccio per risolvere queste sfide. Invece di utilizzare modelli diversi, unifica le capacità di comprensione e generazione in un unico modello.
Questa unificazione consente al modello di adattare la risposta vocale generata al contesto acustico (ad esempio, tono, stile) e all’input parlato, ottenendo un dialogo più naturale. Nova Sonic comprende persino le sfumature della conversazione umana, comprese le pause e le esitazioni naturali di chi parla, l’attesa nel parlare fino al momento appropriato e la gestione delle intromissioni.
Inoltre, genera anche una trascrizione del testo del discorso dell’utente, consentendo agli sviluppatori di utilizzare quel testo per chiamare strumenti e API specifici per la creazione di agenti AI abilitati alla voce. Queste funzionalità, insieme all’inferenza che Amazon definisce fulminea, rendono le applicazioni vocali basate su Nova Sonic più naturali e utili.
Maggiori informazioni su Amazon Nova Sonic sono disponibili sul sito di AWS.









