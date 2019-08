In occasione dell’AWS re: Invent 2016 l’azienda aveva annunciato Amazon Polly, un servizio gestito di text to speech che mira a trasformare il testo in un parlato realistico. Il servizio è stato progettato per consentire ai clienti AWS di creare applicazioni che “parlassero” e di sviluppare categorie completamente nuove di prodotti speech-enabled.

Tutto ciò, senza che fosse richiesta alcuna esperienza di machine learning, ma semplicemente chiamando un’apposita API. Da allora, sottolinea AWS, il team di sviluppo della tecnologia ha aggiunto regolarmente nuove voci, per un totale attuale di 29 lingue e 59 voci (a questo link è consultabile la lista delle lingue e delle voci disponibili).

Ora AWS ha annunciato due importanti novità per Amazon Polly: Neural Text-To-Speech e un nuovo stile di parlato che l’azienda non esita a definire rivoluzionario.

Per quanto riguarda il primo punto, un nuovo approccio di apprendimento automatico, spiega AWS, denominato Neural Text-To-Speech (NTTS), offre miglioramenti significativi nella qualità del parlato. NTTS aumenta la naturalezza e l'espressività, due fattori chiave per un discorso artificiale realistico, che si avvicini quanto più possibile a una voce umana.

Al momento, NTTS è disponibile per 11 voci: le tre in inglese GB (Amy, Emma e Brian) e le 8 in inglese US (Ivy, Joanna, Kendra, Kimberly, Salli, Joey, Justin e Matthew).

La qualità del parlato è certamente importante, sottolinea ancora AWS, ma si può fare di più per rendere il suono di una voce sintetica ancora più realistico e coinvolgente. Qui entra in gioco lo stile. Le persone possono percepire la differenza tra uno stile di parlato da telegiornale, da contesto sportivo, di una lezione universitaria e così via. Solitamente, le persone adottano lo stile colloquiale adatto al contesto in cui si trovano, e questo aiuta a trasmettere il messaggio del discorso.

Proprio grazie a NTTS, spiega AWS, è possibile applicare stili al parlato sintetizzato e ora con Polly è possibile utilizzare uno stile da giornalisti, da conduttori di telegiornale.

Questo stile è adatto alla lettura di notizie ma anche dei post sui blog, e rende la narrazione ancora più realistica, grazie a una voce di alta qualità che suona come ci si potrebbe aspettare da un telegiornale o un giornale radio.

Al momento, lo stile giornalista è disponibile per due voci inglesi statunitensi (Joanna e Matthew).

Maggiori informazioni su Amazon Polly sono disponibili a questo link.