A competição de Processamento de Fala e Língua Vietnamita (VLSP) faz parte da conferência internacional anual sobre Processamento de Fala e Língua Vietnamita, organizada pelo clube VLSP, um braço da Associação Vietnamita de Tecnologia da Informação. A VLSP 2023 organiza 10 competições sobre processamento de fala e texto, reunindo pesquisadores, especialistas e unidades de desenvolvimento tecnológico de ponta. Participando da VLSP 2023, a Viettel AI foi a grande vencedora, conquistando o primeiro lugar em duas categorias: Reconhecimento de Fala e Reconhecimento de Emoções na Fala; e Tradução Automática Vietnamita-Lao.

Em particular, o Reconhecimento Automático de Fala é um dos problemas importantes do processamento de fala, que consiste em converter sinais de fala de entrada em texto correspondente. Este ano, com a inovação na estrutura das categorias da competição, as equipes tiveram que resolver dois problemas simultaneamente: reconhecimento de fala e reconhecimento de emoções na fala. A equipe Viettel AI não só superou esse desafio e conquistou o primeiro lugar, como também impressionou com a excelente pontuação de 89,18% (as equipes seguintes obtiveram 83,40% e 78,45%, respectivamente).

Segundo um representante da Viettel AI, o fator crucial para esse resultado de precisão excepcional é o domínio precoce da tecnologia por parte da empresa. Em vez de utilizar modelos provenientes de pesquisas já existentes, a Viettel AI desenvolveu um modelo específico para o processamento da fala em vietnamita, do zero, atualizando e otimizando continuamente sua eficiência. Combinando isso com o estabelecimento de um ciclo de treinamento capaz de processar todos os dados em diferentes condições de qualidade, os engenheiros conseguiram construir um modelo que reconhece com alta precisão tanto o texto quanto as emoções presentes na frase, mesmo com dados limitados.

aaaaaaaaaa.jpg
Os engenheiros da plataforma de assistente virtual de IA da Viettel participam das categorias de reconhecimento de fala e reconhecimento de emoções na fala.

A tecnologia avançada de Processamento de Fala trouxe resultados significativos para os produtos de IA da Viettel, como sistemas de assistentes virtuais e centrais telefônicas virtuais capazes de reconhecer vozes com até 95% de precisão e intenções do cliente com até 96% de precisão. Em particular, os resultados da pesquisa tecnológica em reconhecimento de voz e emoções, realizada pela concorrência, abrirão novas aplicações no atendimento ao cliente, explorando informações das chamadas para a central telefônica. Reclamações e chamadas negativas de clientes para a central telefônica representam uma pequena parcela das centenas de milhares de chamadas recebidas diariamente, mas têm um grande impacto na qualidade do serviço. Em vez de gastar dinheiro contratando pessoas para ouvir e classificar essas chamadas, como antes, a central telefônica virtual Cyberbot da Viettel será capaz de identificar e lidar automaticamente com as reclamações dos clientes assim que a chamada for recebida.

Por meio dessa competição, a Viettel AI reafirma sua determinação em ser pioneira no desenvolvimento e na aplicação das tecnologias de processamento de fala mais avançadas para aprimorar a qualidade de seus produtos e serviços.

Quoc Tuan