Intelligenza artificiale per la traduzione in tempo reale

Nel lontano 1997 il Babel Fish di AltaVista, che prende il nome da una creatura della Guida galattica per gli autostoppisti di Douglas Adams, era il punto di riferimento per la traduzione di testi online: questo sistema di traduzione è ancora in circolazione oggi, incorporato nel motore di ricerca di Bing.

Oggi è Google Traduttore a dominare la traduzione online. Nel 2016, Google stimava che traducesse oltre 100 miliardi di parole al giorno e avesse oltre 500 milioni di utenti. L'app per smartphone di Google Traduttore riconosce le parole presenti nelle immagini e le traduce all’istante: perfetto per interpretare il menu durante le vacanze all'estero.

Ma ora la traduzione in tempo reale sta arrivando anche nella conversazione, come ci fa notare Massimo Dino Ceresoli di Orange Business Services.

Come funziona

Le versioni precedenti di questa tecnologia ascoltavano il parlato, lo convertivano in testo e infine lo traducevano nella lingua di destinazione. Questo è cambiato con l'intelligenza artificiale.

Ora, quando un motore di traduzione ascolta le parole pronunciate, cercherà di identificare la lingua che ascolta e ciò che viene detto. Le forme d'onda del suono vengono analizzate per identificare quali parti sembrano corrispondere alla traduzione man mano che procede. Il motore tenta quindi di tradurre ciò che pensa di sentire in quello che ritiene essere un normale discorso nella lingua di destinazione.

Viene utilizzata una combinazione di diverse tecnologie di intelligenza artificiale: software di abbinamento di modelli che identificano suoni, reti neurali e apprendimento profondo per identificare "dipendenze di lungo termine" e prevedere ciò che viene detto, con codificatori per elaborare tutte queste informazioni. A supporto c’è un database di parole comuni, significati e informazioni apprese dall’analisi precedente di milioni di documenti.

Questa complessa interazione di tecnologie genera già una precisione di circa l'85%, e la traduzione richiede da due a cinque secondi. La speranza è che con l’evoluzione dell'Intelligenza artificiale migliorino sia fluidità che velocità.

La maggior parte dei sistemi di traduzione esistenti funzionano grazie ad analisi basate sul cloud, il che comporta in genere un breve intervallo tra l'espressione del parlato e la traduzione. È probabile che questo migliori con l’aumento della velocità delle reti.

Scontro tra titani

Siri, Cortana, Alexa e altri assistenti nei nostri dispositivi mobili hanno già imparato a capire quello che diciamo ed eseguire i nostri comandi. Ora stanno imparando a tradurre quelle parole in altre lingue.

Esiste già un hardware per la traduzione in tempo quasi reale: Siri, di Apple, presto tradurrà tra inglese americano e francese, tedesco, italiano, mandarino e spagnolo; iTranslate e Bragi offrono già Dash Pro, che traduce 40 lingue; gli auricolari Pixel Bud di Google funzionano con i dispositivi Android per tradurre fino a 40 lingue (Google offre anche Google Traduttore e Word Lens, che traduce le parole contenute nelle fotografie); un progetto pilota sviluppato da Waverley Lab consiste in due auricolari condivisi tra due persone che non parlano la stessa lingua. Sono stati annunciati altri dispositivi simili, tra cui Translate One2One.

Traduzione vocale in tempo reale

Come ricorda Ceresoli, Microsoft sta inserendo la traduzione in tempo reale all'interno di molti dei suoi prodotti, tra cui Skype for Business, Skype Meeting Broadcast, traduzione in diretta di PowerPoint, e fornisce inoltre agli sviluppatori delle API per favorire lo sviluppo di queste tecnologie. I partner applicativi includono contact center, business intelligence e sottotitoli multimediali.

Skype Translator ha visto l'uso espandersi del 400% nel suo primo anno di disponibilità:  la coppia di lingue più popolare è risultata essere il francese e l’inglese.

Sicuramente c'è un modo per utilizzare queste tecnologie che consente la collaborazione con i mercati emergenti - nel 2016 il principale corridoio internazionale di Skype Translator è stato dalla Germania al Ghana. Microsoft sostiene che l'uso delle tecnologie di deep learning ha già reso le sue traduzioni migliori del 20% rispetto a prima.

Questi miglioramenti stanno portando a contributi nel mondo reale in termini di collaborazione. Il preside della Chinook Middle School, nello stato di Washington, usa Microsoft Translator online per parlare con i genitori degli alunni: parla in inglese mentre i genitori seguono nella loro lingua.

Microsoft intende implementare i suoi strumenti di traduzione all'interno dell'ambiente Microsoft Teams entro la fine dell'anno. È probabile che questo faccia accelerare l'uso di queste tecnologie in azienda: la società afferma che sono già 200.000 le organizzazioni che utilizzano questo servizio.

Affari internazionali

Per Ceresoli con il miglioramento delle tecnologie di apprendimento automatico e di rete, sembra probabile che la maggior parte delle aziende inizi a utilizzare maggiormente questi strumenti di traduzione in tempo reale, che possono contribuire a sbloccare nuove opportunità per creare nuovi canali di redditività. La connettività certo dovrà essere solida, in particolare nel conferencing center aziendale, per sostenere la domanda.

La piattaforma Anywhere365 Contact Center e Enterprise Dialogue Management di Workstreampeople offrono già traduzione vocale in tempo reale, integrandosi in modo nativo nella piattaforma Lync/Skype for Business.

“Translate your World” offre già un sistema di conferenza Web collaborativo abilitato alla traduzione in tempo reale. Fornisce tutti gli strumenti che ci si può aspettare di trovare in un sistema come questo, integrati con la traduzione in tempo reale di ciò che dicono i presentatori.

Il CEO di Lingmo International, Danny May, ritiene che l'intelligenza della macchina fornisca il collegamento mancante. "Le app di traduzione tradizionali non aiutano molto nelle situazioni del mondo reale. Si perdono troppo del contesto e delle sfumature, e generalmente sono senza speranza quando si tratta di dialetti", ha scritto in un post per il blog di IBM. "Sfruttando le capacità di intelligenza artificiale di Watson, ci siamo resi conto che potevamo raggiungere i nostri obiettivi in ​​modo molto più efficiente", ha affermato.

La traduzione della voce ha utilizzi al di là del business. Durante la guerra in Iraq, le forze statunitensi erano dotate di dispositivi di traduzione, cosa che suggerisce un potenziale uso militare per tali tecnologie. I soccorritori, i servizi di assistenza pubblica, le ONG e le organizzazioni umanitarie troveranno senza dubbio utili questi sistemi nel loro lavoro. Ecco perché il sistema auricolare One2One di IBM Watson, fornito da Lingmo International, è stato presentato al Summit globale “AI for Good” delle Nazioni Unite.

I ricercatori di Google Brain stanno sviluppando reti neurali che potrebbero diventare capaci di tradurre senza utilizzare i dati scritti come riferimento: questo potrebbe consentire alle macchine di tradurre lingue poco conosciute - quando Haiti è stata colpita dal terremoto nel 2010, non esisteva alcun software di traduzione per il creolo locale.

Di certo, le parole non sono tutto: la comunicazione è complessa. Diversi studi del Dr. Albert Mehrabian, professore emerito di psicologia presso l’UCLA (un esperto globale in comunicazione verbale/non verbale), mostrano che mentre il 43% delle comunicazioni è verbale, il 55% non lo è. Il Comitato internazionale della Croce Rossa sottolinea che i suoi interpreti devono essere in grado di entrare in connessione e ispirare fiducia nelle persone, integrandosi con la cultura di un paese.

Le soluzioni di traduzione in tempo reale possono aiutare a superare le barriere linguistiche, ma il compito di creare fiducia e comprensione richiede un insieme di comportamenti molto più complesso, insieme al rispetto delle differenze culturali.

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato sulle novità tecnologiche iscriviti alla newsletter gratuita.

LASCIA UN COMMENTO

Please enter your comment!
Please enter your name here