Google ha anunciado el desarrollo de Translatotron, un nuevo sistema automatizado de traducción casi simultánea capaz de imitar la voz del emisor. Hasta ahora, los sistemas habían conseguido con bastante éxito traducir textos a voz, textos a textos y voz a textos. Algunos dispositivos, como el traductor de Ashata o Fosa Traductor, ya realizan estas funciones con dispositivos de mano o auriculares conectados por bluetooth, pero no imitan el tono de los conversadores.
Los ingenieros de programas de Google Ye Jia y Ron Weiss han anunciado en el blog de inteligencia artificial de la compañía este nuevo paso en la traducción simultánea, que intenta evitar el paso intermedio de leer la conversación (aunque esta se puede desplegar en los dispositivos de prueba por si se ha desoído una parte), aumentar de esta forma la velocidad de la interacción, obviar palabras que no necesitan traducción (como pronombres implícitos en la persona del verbo en castellano) y, especialmente, aprender del sistema de voz para evitar errores e imitarlo.
La mayor novedad de Translatotron es esta, que el traductor imita el tono y la cadencia de las frases, algo fundamental en la comunicación verbal. El sistema está fundamentado en un modelo de secuencia a secuencia y se alimenta de espectogramas (inscripción o diagrama de un espectro acústico) que se utilizan para imitar las voces.