Translatotron é o tradutor da Google que imita a voz do usuário
Utilizando IA, a tecnologia consegue traduzir e falar em tempo real, adotando aspectos da voz humana.
A Google anunciou em seu blog de inteligência artificial o Translatotron, uma tecnologia que permite fazer traduções em tempo real e consegue imitar a voz humana. Segundo a companhia, a novidade é o primeiro sistema de ponta a ponta capaz de fazer traduções diretamente por áudio para que duas pessoas consigam manter uma conversa em idiomas diferentes.
A tecnologia de tradução em tempo real não é algo novo e a equipe do Google já vem trabalhando em ferramentas do tipo há tempos, inclusive com a Google Assistente, mas a empresa adicionou um grande diferencial no Translatotron: o programa capta a sua voz e consegue imitá-la falando outro idioma.
Uma nova abordagem
Normalmente, os sistemas de tradução utilizam um sistema de cascata que funciona em três passos: transformar a fala em texto, traduzir para outro idioma e, depois, transformar a sentença novamente em áudio. O objetivo do Translatotron é deixar esse processo mais simples e próximo da voz do usuário.
Como trabalha diretamente com a voz, o Translatotron consegue fazer a tradução sem precisar converter o conteúdo da mensagem para o texto. Além disso, graças a captação de som, a ferramenta também consegue manter trejeitos e aproximar o conteúdo final da voz do usuário, como mostram algumas amostras publicadas no site da Google.
No momento, a nova tecnologia de tradução não conta com tanta qualidade como as soluções convencionais. Ainda assim, como faz uso de inteligência artificial, a tendência é que a novidade se torne mais potente com o passar do tempo.
“Esperamos que este trabalho possa servir como ponto de partida para pesquisas futuras sobre sistemas de tradução de voz para fala de ponta a ponta”, explicam os engenheiros do Google IA no post de anúncio do projeto. Agora, o negócio é esperar para que a tecnologia continue evoluindo e seja implementada nos serviços da empresa, como o Google Tradutor e o Interpreter Mode, ferramenta da Google Assistente que funciona em 27 idiomas diferentes.
Esta reportagem foi publicada originalmente no site Terra, em 17 de maio de 2019.
Foto de Christian Wiediger na Unsplash