AIへの世界的な関心は高まっており、その注目は米国や中国など、世界をリードするAIモデルを数多く擁する国々に集中しています。世界的に重要な経済地域の一つである東南アジアは、AIの新たなホットスポットとなりつつあり、世界の政策立案者、投資家、そして技術専門家の関心を引くような大きな進歩を遂げています。

ベトナムにおいても、党と政府は、科学技術開発、イノベーション、国家のデジタル変革における飛躍的進歩に関する決議57-NQ/TWを通じて、国の技術開発時代を形作り、推進する決意を固めています。この方針は、国内のテクノロジー企業が投資を行い、世界の先進技術の潜在力を活用するための強力な原動力となっています。
現在、ベトナムは東南アジアで数少ない国産大規模言語モデル(LLM)を保有する国の一つとなっています。具体的には、2023年からZaloがベトナム語に特化したLLMモデルの学習とリリースに成功しており、このモデルはベトナム人エンジニアチームによって完全に研究開発されています。
トレーニングをゼロから選択して予想外の結果を得る
現在、AI モデルには 2 つのトレーニング手法があります。微調整モデル手法は、以前にトレーニングした LLM を最適化して、特殊な目的のために新しい LLM を作成する方法です。ゼロからのモデル トレーニング手法は、パラメーターの初期化、モデル アーキテクチャの決定から特定のデータ セットでのアルゴリズムのトレーニングまで、完全に新しいモデルを構築するプロセスです。
中でも、ファインチューニング手法は、導入の容易さ、リソースの節約、効率性の向上といったメリットから、多くの企業に選ばれています。特に、トレーニング機器やデータが限られているベトナムにおいては、ファインチューニング手法は優れたソリューションとなります。
しかし、Zaloは当初からこの学習手法を選択しました。この手法では、学習プロセスとモデル全体がベトナム人によって完全に所有・管理されています。そのおかげで、ベトナムは東南アジアで自国で開発された大規模言語モデル(LLM)を保有する数少ない国の一つとなっています。
2023年のリリース時に、Zalo初の大規模70億パラメータのベトナム語に特化した言語モデルは、VMLUベトナム語LLMコンピテンシーベンチマークにおいて、OpenAIのGPT3.5と比較して150%の性能を達成しました。学習期間はわずか6か月で、当初の18か月計画を大幅に下回りました。この迅速な学習プロセスは、Zalo開発チーム全体を驚かせました。

Zalo の LLM モデルは、2023 年の最初のリリースで Kahoot チャレンジで 3 位にランクされました (写真: Zalo)。
2024年、Zaloの130億パラメータモデルは世界の有名企業を上回り、VMLUのベトナムLLM能力ランキングでゼロからトレーニングされたベトナムLLMモデルのトップ2としての地位を確立しました。
結果は、特に多くの困難に直面した初期開発の状況において、大規模言語モデルのトレーニング レベルがベトナム独自の AI モデルを開発するための世界の水準に劣っていないことを示しています。
AIモデル開発に向けたベトナムの取り組み
Zaloの代表者は、LLM研修には研修機器、データ、技術レベルという3つのコア要素が必要であると述べました。これまでベトナムでは、これら3つの側面すべてにおいて多くの制約がありました。具体的には、世界の大企業がNVIDIAの最新の高性能GPUを数千台も所有している一方で、ベトナムのエンジニアは必要なサーバーインフラを十分に整備されていませんでした。また、ベトナム人は英語や中国語に比べてデータリソースが乏しいグループに属しています。ベトナムの人材とLLM研修の経験も、先進国と比較して限られています。
当時の Zalo チームは、大規模なコンピューティング インフラストラクチャが利用可能になったらすぐに対応できるように、LLM に関する知識とトレーニング能力を獲得するために、小型の民生用 GPU で調査と実験を行う必要がありました。
AIトレーニング用チップは不足しているため、Zaloは8台のNvidia DGX H100サーバーを発注したものの、一度にすべてのデバイスを揃えることはできず、メーカーからの各バッチの納品を待たなければなりません。そのため、不完全なコンピューティングインフラストラクチャを最適化し、トレーニング時間を節約することも、Zaloチームが解決しなければならない課題です。
同時に、ベトナムのデータソースの不足を補うために、質の高いトレーニング データにも投資されています。

世界の大企業と比較すると難しい立場からのスタートでしたが、Zaloはベトナム独自のAIモデル開発を成功させるという目標を掲げ、この競争に参入することを決意しました。適切な開発戦略を策定するため、世界有数の多くの研究機関の研究者やエンジニアと協議を重ねました。
Zaloのエンジニアにとって、現在の成功のマイルストーンは、モデルの最適化を継続し、量と質を向上させるためのモチベーションとなっています。同時に、その応用性を活かし、ベトナムのユーザー向けに世界クラスのAI製品を数多く開発していく所存です」と、Zalo AIのサイエンスディレクターであるNguyen Truong Son博士は述べています。

Zalo が Nvidia に注文した DGX H100 サーバー (写真: Zalo)。
Zalo は、開発の初期段階の困難さを柔軟に適応させたおかげで、徐々に成功を収め、今日のグローバル AI テクノロジーの習得に向けて前進しています。
現在、Zalo の AI モデルはトレーニング研究の面で成功しているだけでなく、応用面でも成功しており、ベトナムの人々にとって高度な新技術から得られる価値の活用を促進しています。
Zaloは今年初め、Kiki Info Q&Aアシスタントをリリースしました。これはZaloメッセージングプラットフォーム上のOA(公式アカウント)として運営されています。このアシスタントは、生活、コンテンツ制作、エンターテイメントなど、様々なトピックに関するQ&Aをサポートします。Zaloの統計によると、Kiki Infoアシスタントは2ヶ月足らずで100万人のユーザーがZaloのOAアカウントにアクセスしています。

Kiki Info Assistant の開発には、Zalo の LLM モデルが適用されています (写真: Zalo)。
ZaloのLLMモデルのもう一つの応用はAIカードで、こちらもわずか2ヶ月で1,500万枚のカードが作成・送信され、マイルストーンを達成しました。これは、大切な祝日に親戚や友人にお祝いのメッセージを送るために、多くのZaloユーザーが関心を持つアプリケーションです。
現在、大規模言語モデルのアプリケーションはZaloによって拡張および開発され続けており、国内ユーザーに多くの有用な価値をもたらすことが期待されています。
出典: https://dantri.com.vn/cong-nghe/zalo-phat-trien-mo-hinh-ai-do-nguoi-viet-lam-chu-20250616161352610.htm
コメント (0)