Конкурс Vietnamese Language and Speech Processing - VLSP является частью ежегодной международной конференции по вьетнамскому языку и обработке речи, организованной клубом VLSP, филиалом Вьетнамской ассоциации информационных технологий. VLSP 2023 организует 10 конкурсов по обработке речи и текста, объединяя ведущих исследователей, экспертов и подразделения по разработке технологий. Участвуя в Vietnamese Language and Speech Processing 2023, Viettel AI одержал победу, завоевав первую премию в 2 категориях: Распознавание речи и распознавание эмоций речи; Машинный перевод с вьетнамского на лаосский.

В частности, автоматическое распознавание речи является одной из важных проблем обработки речи для преобразования входных речевых сигналов в соответствующий текст. В этом году, с инновацией в структуре категорий конкурса, командам пришлось решать две задачи одновременно: распознавание речи и распознавание речевых эмоций. Viettel AI не только преодолел это испытание, завоевав первый приз, но и поразил выдающимся результатом в 89,18% (следующие команды набрали 83,40% и 78,45% соответственно).

По словам представителя Viettel AI, ключевым моментом, ведущим к такому выдающемуся результату точности, является то, что Viettel AI освоил технологию на ранней стадии. Вместо того чтобы использовать модели из имеющихся результатов исследований, Viettel AI разработал модель специально для обработки вьетнамской речи с нуля и постоянно обновлял и оптимизировал ее эффективность. В сочетании с созданием цикла обучения, который может обрабатывать все данные в различных условиях качества, инженеры успешно построили модель, которая может распознавать как текст, так и эмоции предложения с высокой точностью в условиях ограниченных данных.

аааааааааааа.jpg
Инженеры платформы виртуального помощника Viettel AI участвуют в категориях «Распознавание речи» и «Распознавание эмоций речи»

Технология Advanced Speech Processing принесла значительные результаты продуктам Viettel AI, таким как системы виртуальных помощников, виртуальные коммутаторы, которые могут распознавать голос с точностью до 95% и определять намерения клиентов с точностью до 96%. В частности, результаты исследований технологии распознавания голоса и эмоций от конкурентов откроют новые приложения в обслуживании клиентов, используя информацию из звонков на коммутатор... Жалобы и негативные звонки от клиентов на коммутатор часто составляют небольшое количество сотен тысяч звонков на коммутатор поддержки каждый день, но оказывают большое влияние на качество обслуживания. Вместо того, чтобы тратить деньги на найм людей для прослушивания и маркировки этих звонков, как раньше, виртуальный коммутатор Viettel Cyberbot сможет автоматически определять и обрабатывать жалобы клиентов, как только поступает звонок.

Посредством конкурса компания Viettel AI подтверждает свою решимость стать пионером в разработке и применении самых передовых технологий обработки речи для улучшения качества продукции и услуг.

Куок Туан