Tacotron 2, es la estructura de redes neuronales desarrollada por Google que tiene como propósito humanizar la voz sintética a la que estamos acostumbrados. La idea de tacotron 2, es lograr generar un discurso fluido, natural, sin entrenarse con gran cantidad de metadatos sobre lenguaje o gramática.

 

La gigante Google compartió una serie de audios a través de GitHub en donde reta a los usuarios a identificar la voz sintética y humana, esto, porque los resultados de Tacrotron 2 son increíbles.Los audios podemos encontrarlos en el siguiente enlace.

Lee: ¡Nuevamente! Game of Thrones vuelve a ser la más pirata

Se puede notar en los audios, el cambio en la expresividad, las variantes de ritmo con los signos de puntuación y la entonación.

Sin duda, hay mucho que mejorar, sin embargo, no se puede negar el parecido que existe a la voz humana, y podemos decir que ha quedado atrás la voz robotizada. Si quieres más información puedes ver todos los aspectos técnicos de este nuevo sistema de Google.