Índice do Artigo

Notícias

Baidu pretende superar Google com IA que imita perfeitamente a voz humana

Se você conhece a Baidu apenas pela Toolbar e o Antivírus que se instalam quase sozinhos nos computadores, saiba que os novos projetos da empresa chinesa pretendem superar o Google.

Além de estar desenvolvendo um carro autônomo, a companhia apresentou recentemente uma pesquisa feita junto com o instituto de tecnologia MIT para fazer um sintetizador de voz com inteligência artificial que imita perfeitamente a voz humana.

O projeto se chama Deep Voice e, assim como o projeto WaveNet do Google, tem como objetivo transformar informações de texto em voz. Porém, diferente da tecnologia da concorrente, a Baidu promete que seu sistema será tão avançado que poderá expressar até mesmo emoções.

Para fazer isso, o sistema do Baidu utiliza machine learning e um sistema que transforma palavras em fonemas, unidade mínima da fala, que são unidos por uma rede neural. Exemplificando, o Deep Voice entende o texto “hello” como “(silêncio HH), (HH, EH), (EH, L), (L, OW), (OW, silêncio)”.

De acordo com o Engadget, o WaveNet do Google também possui capacidade para alcançar a voz humana, porém, exige muito processamento para isso, o que acaba o tornando inviável para uso em assistentes de voz de smartphones, por exemplo.

Assim como o Google, o Baidu ainda não apresentou uma solução para processar as palavras em tempo real. Segundo a empresa, para chegar a um nível humano, um computador teria que processar as palavras em, no mínimo, 20 microssegundos, o que ainda não é possível.