A competição de Processamento de Fala e Língua Vietnamita (VLSP) faz parte da conferência internacional anual sobre Processamento de Fala e Língua Vietnamita, organizada pelo clube VLSP, uma filial da Associação Vietnamita de Tecnologia da Informação. A VLSP 2023 organiza 10 competições sobre processamento de fala e texto, reunindo pesquisadores, especialistas e unidades de desenvolvimento tecnológico de ponta. Participando da competição de Processamento de Fala e Língua Vietnamita 2023, a Viettel AI conquistou o primeiro lugar em duas categorias: Reconhecimento de Fala e Reconhecimento de Emoções da Fala; Tradução Automática Vietnamita - Laosiana.
Em particular, o Reconhecimento Automático de Fala é um dos problemas importantes do processamento da fala para converter sinais de entrada de fala em texto correspondente. Este ano, com a inovação na estrutura das categorias da competição, as equipes tiveram que resolver dois problemas simultaneamente: reconhecimento de fala e reconhecimento de emoções na fala. A Viettel AI não só superou esse desafio e conquistou o primeiro lugar, como também impressionou com uma pontuação excepcional de 89,18% (as equipes seguintes obtiveram 83,40% e 78,45%, respectivamente).
De acordo com o representante da Viettel AI, o ponto-chave que levou a este resultado de precisão excepcional é que a Viettel AI dominou a tecnologia desde o início. Em vez de usar modelos de resultados de pesquisa disponíveis, a Viettel AI desenvolveu um modelo específico para processar a fala vietnamita do zero, atualizando e otimizando continuamente sua eficiência. Combinado com o estabelecimento de um ciclo de treinamento que pode processar todos os dados em diferentes condições de qualidade, os engenheiros construíram com sucesso um modelo que pode reconhecer tanto o texto quanto as emoções da frase com alta precisão, sob condições de dados limitadas.
A tecnologia avançada de processamento de fala trouxe resultados significativos para os produtos de IA da Viettel, como sistemas de assistente virtual e centrais telefônicas virtuais que reconhecem a voz com até 95% de precisão e identificam as intenções do cliente com até 96%. Em particular, os resultados da pesquisa sobre tecnologia de reconhecimento de voz e emoção da concorrência abrirão novas aplicações no atendimento ao cliente, explorando informações de chamadas telefônicas... Reclamações e chamadas negativas de clientes para a central telefônica geralmente representam um pequeno número de centenas de milhares de chamadas para a central telefônica de suporte todos os dias, mas têm um grande impacto na qualidade do serviço. Em vez de gastar dinheiro contratando pessoas para ouvir e marcar essas chamadas como antes, a central telefônica virtual Viettel Cyberbot será capaz de identificar e lidar automaticamente com as reclamações dos clientes assim que a chamada for recebida.
Por meio da competição, a Viettel AI afirma sua determinação em ser pioneira no desenvolvimento e na aplicação das mais avançadas tecnologias de processamento de fala para melhorar a qualidade de produtos e serviços.
Quoc Tuan
Fonte
Comentário (0)