martedì 3 giugno 2014

Il traduttore simultaneo del futuro

Skype contro la Torre di Babele

di Luca Annunziata, 28 mag 2014

Un sistema di traduzione consecutiva automatico. 
Integrato nel software per le videochiamate VoIP, sarà realtà a partire dalla fine del 2014.

Alla mente torna subito il traduttore universale di Star Trek, o il Babelfish della Guida Galattica: quanto mostrato da Microsoft, tramite la sua controllata Skype sul palco della conferenza statunitense Code è la realizzazione di quello che fino a pochi anni fa era solo una speculazione della fantascienza. 
Il CEO Satya Nadella, assieme al collega Gurdeep Pall che sovrintende alla messagistica per Microsoft, ha mostrato al pubblico quello che ha chiamato "Skype Translator": un sistema di intelligenza artificiale che ascolta, traduce e ripete in un'altra lingua come in un intepretariato consecutivo, con una precisione non paragonabile (almeno in questa demo, senza dubbio pure ampiamente preparata e sperimentata) a quella di un professionista umano, ma comunque in grado di garantire il passaggio dell'informazione.







Il traduttore miracoloso è frutto della collaborazione tra Microsoft Research e il team Skype: stando alle parole di Nadella la tecnologia mostrata è oggetto di studio e sviluppo da almeno un decennio, ma solo ora con il progressivo ampliamento delle capacità computazionali e la ampia disponibilità del cloud computing per supportare il funzionamento in remoto del motore di traduzione è stato possibile renderla disponibile al pubblico. Qualcosa di simile è già disponibile nelle API per la traduzione del testo presenti in Azure, ma la possibilità di applicare lo stesso meccanismo in tempo reale a una conversazione audio-video ha naturalmente richiesto uno sforzo ulteriore di integrazione.

Sul piano della ricerca, dai laboratori di Pechino spiegano che un grosso è stato fatto naturalmente nell'addestramento del motore che comprende e traduce nelle diverse lingue. Non solo si è badato al parlato, ma anche alle forme di espressione scritta tipiche di ambienti informali come i social network. Mettendo assieme questi studi, un meccanismo di riconoscimento del parlato molto sofisticato, alcune ricerche relative alla pronuncia dei fonemi e applicando a tutto una rete neurale in grado di apprendere progressivamente nuove capacità (modellata sulle recenti tendenze multi-livello - DNN: deep neural network - per farla assomigliare nella sua concezione al cervello umano), il risultato è quanto mostrato sul palco californiano: un sistema chiaramente ancora imperfetto, ma impressionante nella sua capacità di offrire quantomeno una traduzione comprensibile nel senso a due interlocutori parlanti inglese e tedesco.

Tornando alla pratica, e agli affari, Redmond non perde l'occasione per spiegare come questa idea di Skype Translator non sia altro che un esempio del nuovo approccio One Microsoft: il riconoscimento del parlato è già stato reimpiegato per lo sviluppo di Cortana, l'assistente vocale di Windows Phone 8.1, e la tecnologia sviluppata da Microsoft Research ha trovato un valido supporto per affinarne le capacità nel team Skype. Non era la prima volta che questi algoritmi venivano mostrati al pubblico, il loro debutto ufficiale è avvenuto nel 2012, ma l'integrazione in un prodotto destinato al pubblico sarebbe il punto di svolta che per Microsoft significa che il prodotto è davvero pronto.

Skype Translator sarà distribuito come app in beta entro la fine del 2014, per ora in esclusiva su Windows 8 e versioni successive del sistema desktop. In seguito saranno realizzate anche versioni specifiche per tutte le piattaforme su cui Skype è già disponibile, anche se in questo caso non è dato conoscere quali saranno i tempi effettivi di sviluppo.

Nessun commento:

Posta un commento