Índice do Artigo

Notícias

IBM vence a Microsoft e volta a dominar o record de reconhecimento de fala

A IBM conseguiu melhorar seus sistemas de reconhecimento da fala humana até atingir uma taxa de erros de apenas 5,5%. Essa taxa é a atual menor do mundo, vencendo a detentora anterior do record, a Microsoft, que tinha conseguido atingir 5,9%.

A taxa de erros no reconhecimento da fala é um valor importantíssimo, que tem sua própria sigla em inglês WER (word error rate), uma vez que o número define, basicamente, a capacidade de um sistema computadorizado de reconhecer a fala humana. A IBM já teve esse record antes, com 6,6%, mas depois foi batida pela Microsoft, quando a criadora do Windows alcançou os 6,3%.

Mais tarde, a Microsoft foi além e baixou o valor para 5,9%, chegando a considerar o número equivalente à WER humana. A IBM, então, não só conseguiu vencer a taxa, mas também abaixou ainda mais a bola da Microsoft, dizendo que a paridade com humanos está um pouco mais distante, nos 5,1%, na verdade.

Alcançar a paridade humana – ter uma taxa de erros parelha com a de dois seres humanos conversando – tem sido há tempos o objetivo supremo da indústria. Outros na indústria estão buscando este marco junto conosco, e alguns alegaram recentemente alcançar os 5,9% como equivalente à paridade humana… Mas nós não vamos abrir a champanhe ainda. Como parte do nosso processo em alcançar o marco de hoje, nós determinamos que a paridade humana é, na verdade, mais baixa do que qualquer um já alcançou — em 5,1%

Imagens exclusivas do executivo da IBM depois da declaração:

via GIPHY