ベトナム語と音声処理 - VLSPコンペティションは、ベトナム情報技術協会の支部であるVLSPクラブが主催する、ベトナム語と音声処理に関する年次国際会議の一環です。VLSP 2023では、音声とテキスト処理に関する10のコンペティションが開催され、一流の研究者、専門家、技術開発部門が一堂に会します。Viettel AIは、 ベトナム語と音声処理 2023に参加し、音声認識と音声感情認識、そしてベトナム語 - ラオス語機械翻訳の2つのカテゴリーで最優秀賞を受賞しました。

特に、自動音声認識は、入力された音声信号を対応するテキストに変換する音声処理における重要な課題の一つです。今年は、コンテストのカテゴリー構成が刷新されたため、チームは音声認識と音声感情認識という2つの課題を同時にこなす必要がありました。Viettel AIはこの課題を克服して優勝を果たしただけでなく、89.18%という驚異的なスコアで人々を魅了しました(2位チームはそれぞれ83.40%と78.45%でした)。

Viettel AIの担当者によると、この卓越した精度を実現できた鍵は、Viettel AIが早期に技術を習得したことにあるという。既存の研究成果に基づくモデルを使用するのではなく、Viettel AIはベトナム語音声処理に特化したモデルをゼロから開発し、継続的に更新・最適化することで効率性を高めてきた。様々な品質条件におけるあらゆるデータを処理できるトレーニングサイクルを確立したことに加え、エンジニアたちは限られたデータ条件下でも、テキストと文章の感情の両方を高精度に認識できるモデルの構築に成功した。

ああああああああ.jpg
Viettel AI仮想アシスタントプラットフォームのエンジニアが音声認識と音声感情認識のカテゴリーに参加

高度な音声処理技術は、最大95%の精度で音声を認識し、最大96%の精度で顧客の意図を識別できる仮想アシスタントシステム、仮想交換機などのViettel AI製品に大きな成果をもたらしました。特に、競合他社の音声および感情認識技術の研究成果は、交換機の通話からの情報を活用して、カスタマーケアの新たなアプリケーションを開拓します...交換機への顧客からの苦情や否定的な電話は、サポート交換機への毎日の数十万件の通話のうちの少数を占めることがよくありますが、サービスの品質に大きな影響を与えます。これまでのようにこれらの通話を聞いてマークする人を雇うためにお金を使う代わりに、Viettel Cyber​​bot仮想交換機は、通話を受信するとすぐに顧客の苦情を自動的に識別して処理することができます。

Viettel AIは、このコンテストを通じて、最先端の音声処理技術の開発と応用を先導し、製品とサービスの品質を向上させる決意を表明します。

クオック・トゥアン