Zalo AIの才能ある若手エンジニア、Le Duy Khanh氏は、 2024年9月1日から5日までギリシャで開催されるInterspeech Scientific Conferenceで、自身の科学的テーマを紹介するスピーチを終えたばかりです。
「タイムシフトコンテキストアテンションと動的右コンテキストマスキングによるストリーミング音声認識の改善」というテーマで、 2000年生まれのエンジニアとその同僚の研究作業は、音声認識モデルのアップグレード、Zalo アプリケーションでの音声ディクテーションと音声テキスト変換の精度の向上に大きく貢献します。
この研究は、音声認識モデルに「未来を予測する」のと同様に、より多くのコンテキストを提供することで、遅延を増加させることなく精度を大幅に向上させることを目指しています。これは、先行研究との大きな違いです。
「テクノロジー全般、特に音声処理の分野で世界をリードする科学会議で発表する機会を得たのは今回が初めてです。これが、AI開発の道を追求し続け、Zalo AIの研究に貢献していくための私のモチベーションです」とDuy Khanh氏は語りました。 Khanh氏の会議でのプレゼンテーションは、100人以上が視聴する中、非常にスムーズに進みました。プレゼンテーション終了後、Khanh氏はアルゴリズムと処理速度について2つの質問を受けました。今年のInterspeech International Conferenceには、Microsoft、Metaなど、世界をリードする一連のテクノロジー企業が参加しました。さらに、世界中のエンジニア、テクノロジー、AI研究者による2,000件を超える会議発表とAI分野に関する新しい研究も発表されました。
ベトナムのエンジニアの研究テーマが国際的に認められているという事実は、ベトナムの若いAI産業にとって前向きな兆候です。
「今回のインタースピーチへの参加は、私にとって大きな節目となるだけでなく、AI技術をベトナムのユーザーにもっと身近に届けるために努力するモチベーションにもなります。特に私たちのような若いエンジニア、そしてベトナムのAI技術業界全体が発展していくためには、研究への投資が不可欠です。AIの活用には常に研究が必要であり、他社の既存の技術だけを利用していては、大きな成果を上げることは難しいでしょう」とデュイ・カーンは語りました。
Zaloは2017年にAI研究を開始して以来、デュイ・カーン氏のような若い才能を常に信頼してきました。現在、Zalo従業員の31%がGenZ世代に属しています。ZaloのAIエンジニアが科学論文で国際的に認められたのは今回が初めてではありません。2021年には、アジア太平洋国際人工知能会議(PRICAI 2021)で、さらに2つの研究テーマが認められました。
コメント (0)