人工知能(AI)への世界的な関心は高まっており、特に米国や中国といった先進的なAIモデルを持つ国々に注目が集まっている。世界で最も重要な経済圏の一つである東南アジアは、AI分野における新たなホットスポットとして徐々に台頭しつつあり、その目覚ましい進歩は、世界中の政策立案者、投資家、技術専門家の注目を集める可能性がある。

ベトナムでは、党と政府が、 科学技術革新および国家デジタル変革における飛躍的進歩に関する決議57-NQ/TWに示されているように、国の技術発展時代を形成・推進することにも力を入れています。この方針は、国内のテクノロジー企業が先進的なグローバル技術に投資し、その潜在能力を活用するための強力な推進力となっています。
現在、ベトナムは東南アジアで数少ない、独自の言語モデル(LLM)を持つ国の一つとなっています。具体的には、2023年以降、Zaloはベトナム語に特化したLLMモデルのトレーニングと運用を成功させており、このモデルはベトナム人エンジニアのチームによって完全に研究開発されたものです。
ゼロからトレーニングを始めることを選択すれば、驚くべき結果が得られるでしょう。
現在、AIモデルは2つのトレーニング手法を採用しています。1つは、以前にトレーニングされたLLMを最適化して特定の目的に合わせた新しいLLMを作成するファインチューニングモデリング、もう1つは、パラメータの初期化やモデルアーキテクチャの決定から、与えられたデータセットでのアルゴリズムのトレーニングまで、まったく新しいモデルを構築するプロセスであるゼロからのモデリングです。
中でも、微調整技術は、導入の容易さ、リソースの節約、そしてより良い成果の可能性といった利点から、多くの企業に選ばれています。特に、トレーニング機器やデータが限られているベトナムにおいては、微調整技術は優れた解決策と言えるでしょう。
しかし、Zaloはゼロからトレーニングを行うことを選択しました。この方法により、トレーニングプロセス全体とモデルは完全にベトナム人によって所有・管理されています。その結果、ベトナムは東南アジアで数少ない、国内で開発された大規模言語モデル(LLM)を持つ国の1つとなりました。
2023年のローンチ当時、Zaloが開発した70億個のパラメータを持つ最初の大規模言語モデルは、ベトナム語に特化し、ベトナム語のLLM能力評価基準であるVMLUにおいて、OpenAIのGPT3.5と比較して150%の性能を達成しました。トレーニング期間はわずか6ヶ月で、当初の18ヶ月という見積もりを大幅に下回りました。この迅速なトレーニングプロセスは、Zaloの開発チーム自身も驚かせました。

ZaloのLLMモデルは、2023年の初回リリース時にKahootチャレンジで3位にランクインした(写真:Zalo)。
2024年、Zaloの130億個のパラメータを持つモデルは、主要なグローバルブランドを凌駕し、VMLUのベトナムLLM能力ランキングにおいて、初心者向けトレーニングのためのベトナムLLMモデルの中でトップ2の地位を獲得した。
調査結果は、ベトナムの大規模言語モデリングにおける訓練レベルが、特に開発初期段階における課題を考慮すると、自国のAIモデル開発における世界水準に匹敵することを示している。
ベトナムの人々によるAIモデル開発への取り組み。
Zaloの担当者によると、LLMプログラムのトレーニングには、トレーニング機器、データ、技術的専門知識という3つの主要要素が必要だという。これまでベトナムは、これら3つの分野すべてにおいて大きな制約に直面していた。具体的には、大手グローバル企業がNvidia製の最新高性能GPUを数千台も保有している一方で、ベトナムのエンジニアは必要なサーバーインフラを欠いていた。同時に、ベトナム語のデータプールは英語や中国語に比べて少なかった。さらに、ベトナムの人材とLLMトレーニングに関する経験も、先進国に比べて限られていた。
当時のZaloチームは、大規模なコンピューティングインフラが利用可能になった時点ですぐに使用できるよう、LLMに関する知識とトレーニング能力を迅速に習得するために、小型の民生用GPUで研究と実験を行う必要がありました。
AIトレーニング用チップは不足しているため、ZaloはNvidia DGX H100サーバーを8台発注したものの、すべてのデバイスを一度に受け取ることはできず、メーカーからの納入を段階的に待つ必要がある。そのため、トレーニング時間を最大限に活用できるよう、不完全なコンピューティングインフラを最適化することも、Zaloチームが解決しなければならない課題となっている。
同時に、ベトナム語のデータソース不足を補うため、質の高い訓練データの開発にも投資が行われている。

「大手グローバル企業に比べて大きな課題に直面しながらも、Zaloはベトナムで独自のAIモデルを開発するという目標を掲げ、市場参入を決意しました。適切な戦略を策定するため、世界有数の研究機関の研究者やエンジニアと協議を重ねました。」
「これまでの成功の成果は、Zaloのエンジニアたちがモデルの最適化を継続し、より大規模で質の高いモデルを開発していくためのモチベーションとなっています。同時に、私たちはそのアプリケーションを活用して、ベトナムのユーザー向けにさらに世界レベルのAI製品を開発していきます」と、Zalo AIの科学ディレクターであるグエン・チュオン・ソン博士は述べています。

ZaloはNvidiaからDGX H100サーバーを発注した(写真:Zalo)。
Zaloは、困難な開発初期段階における柔軟な適応力のおかげで、徐々に成功を収め、今日のようなグローバルなAI技術を習得するまでに成長しました。
現在、ZaloのAIモデルは研究やトレーニングにおいて成功を収めているだけでなく、応用も進んでおり、ベトナムの人々が先進的な新技術にアクセスし、その価値を活用することを促進している。
今年初め、ZaloはZaloメッセージングプラットフォーム上で公式アカウント(OA)として運営される総合的なQ&Aアシスタント「Kiki Info」をリリースしました。このアシスタントは、生活、コンテンツ制作、エンターテイメントなど、さまざまなトピックに関するQ&Aをサポートします。Zaloの統計によると、Kiki InfoのZalo上のOAアカウントへのアクセス数は、わずか2か月足らずで100万人に達しました。

ZaloのLLMモデルは、Kiki Info Assistantの開発に適用されました(写真:Zalo)。
ZaloのLLMモデルのもう一つの応用例は、AIグリーティングカードです。これもわずか2ヶ月で1500万枚のカードが作成・送信されました。このアプリケーションは、大切な機会に家族や友人に挨拶を送るためのツールとして、Zaloユーザーから大きな注目を集めています。
現在、Zaloは大規模言語モデルに基づいたアプリケーションの拡張と開発を継続しており、国内ユーザーに多くの有益なメリットをもたらすことが期待されている。
出典:https://dantri.com.vn/cong-nghe/zalo-phat-develop-ai-do-nguoi-viet-lam-chu-20250616161352610.htm








コメント (0)