3月14日午前、ベトナム国立イノベーションセンター(NIC)は、ベトナムにおける人工知能(AI)の発展を促進することを目的とした2025イノベーションチャレンジプログラムを開始した。
イノベーション チャレンジ 2025 は、大規模言語モデル (LLM) のトレーニング、評価、および効率性の向上を目的とした高品質のオープンソース ベトナム語データセットを作成する取り組みとして、ViGen プロジェクトに重点を置いています。
ベトナムのデータセットの出現は、AI モデルがベトナムの文化、文脈、表現をより深く理解できるようにすることを目的としています。このプロジェクトにより、AI開発プロセスにおけるベトナム人の存在感が高まり、デジタル経済の促進にも貢献することが期待されます。

ViGen プロジェクトは、Meta Group、NIC、および組織「AI for Vietnam」の三者協力から始まりました。その中で、国家イノベーションセンターは、ベトナムの国家目標に沿ったプロジェクトの管理、調整、および遵守の確保の役割を果たします。
ViGen プロジェクトの使命は、ベトナムにおける AI アプリケーションの可能性を最大限に引き出すために、AI モデルがベトナム語を根本から自然かつ包括的にサポートできるようにすることです。
ViGen は、AI モデルの機能をトレーニングおよび評価するために、大規模で高品質なオープンソースのベトナム語データセットを構築します。
ViGen プロジェクトは、ベトナムの AI 開発が文化的価値観や倫理基準と整合していることを保証し、地域に適切で責任あるオープンソース AI エコシステムの構築を目指しています。
Meta は、このプロジェクトをサポートするために、モビリティとソーシャル接続に関する洞察や、AI を活用した人口マップのトレーニング データなど、オープンソース データセットを提供します。
国家イノベーションセンター副所長のヴォ・スアン・ホアイ氏によると、AIは世界を変えつつあるという。そのため、AIのトレーニングと評価のための大規模で高品質なオープンソースのベトナム語データセットの開発が緊急の優先事項となっています。
「 ViGenプロジェクトは、科学技術、イノベーション、そして国家のデジタル変革における飛躍的進歩を促進するという政治局決議第57号に沿ったものです。政策立案者、研究者、開発者、専門家、そしてユーザーの共同の努力により、AIをすべてのベトナム国民にとって強力なツールに変え、ベトナムを世界的なAI大国にすることを目指します」と、国家イノベーションセンター副所長は述べた。

ベトナム語を話す人は 1 億人以上いますが、AI モデルのトレーニングに使用されているベトナム語のデータは現在 1% 未満と非常に少ない割合に過ぎません。そのため、AI モデルの出力は情報価値はあるものの自然ではなく、ベトナム語の価値を十分に伝えず、有用性が低く、効果がないものとなっています。
AI for Vietnamの創設者兼CEOであるトラン・ヴィエット・フン氏は、次のように述べています。「 ViGenプロジェクトは、ベトナム語の大規模で高品質なデータセットをコミュニティに貢献し、AIではあまり存在感のない言語と考えられているベトナム語の現状を改善します。」
Tran Viet Hung氏によると、ViGenプロジェクトはLlamaのようなオープンソースモデルの力と価値を示しており、ベトナム語の文脈を考慮した革新的なソリューションの開発を可能にしているという。
実際、ベトナムでは、Misaの情報検索自動化仮想アシスタントやViettelの法律仮想アシスタントなど、Llama大規模言語モデルに基づいて開発されたベトナム語仮想アシスタントが登場しています。これらは、ベトナムの生活、特に公共部門における AI の応用を示す最初の例です。

コメント (0)