上記のメッセージは、9月22日にホーチミン市で開催されたベトナム人工知能デー(AI4VN)2023で、ネイバー社(韓国)のクラウドイノベーション部門責任者であるハ・ジョンウ氏が共有したものです。
生成AIとは、テキスト、画像、動画、音楽など、様々な形式で新しいコンテンツやアイデアを生成できる人工知能の一種です。AIはそこから、大規模言語モデル(LLM)を用いて、新しい歌、薬、映画、ゲームなどを作り出すことができます。
マッキンゼーの最近の推計によると、生成AIは世界経済に4.4兆ドルの貢献をする可能性があります。この調査は、様々な業界における6万件の生成AIの応用事例に基づいています。
ハ・ジョンウ氏によると、生成AIを開発するための主要な言語モデルは現在英語を使用しているため、モデルを他の言語で実行すると不完全になりエラーが発生し、英語であるため使用すると不要なバイアス、特に文化的なバイアスが生じてしまうとのこと。
そのため、データとテクノロジーの習得は、多くの国が将来、他国への依存リスクを克服するために考慮すべき重要な要素であると彼は考えています。例えば、韓国では、NAVERが政府や国内企業のAIアプリケーション展開を支援するために、大規模な韓国語モデルを構築しました。
VinBigdataのゼネラルディレクターであるDao Duc Minh博士も同じ見解で、ベトナム人も安全性と情報の正確性を確保し、政府と社会に最大限貢献できる国産AI製品を開発できると考えています...
ダオ・ドゥック・ミン氏によると、2022年末にchatGPTが立ち上げられたとき、生成AIモデルと大規模言語モデルの研究と立ち上げにおいて、国家間および大企業間の競争の地下波が生まれたという。
具体的には、米国ではOpenAIのchatGPTツールに加え、GoogleのBardやAmazonのTitanといった生成AIモデルが存在します。中国では、BaiduのEarnie Bot、Sense TimeのSenseChat、TencentのHunyan、韓国ではNaverのHyperClova Xなどが挙げられます。
ダオ・ドゥック・ミン氏は、生成AIに適用する大規模言語モデルの開発は容易ではなく、多額の費用がかかると述べた。世界で利用可能な大規模言語モデルプラットフォームに基づいて生成AIを適用した場合、ベトナムは多くのリスクに直面するリスクがある。例えば、大規模な外国語モデルの場合、ベトナム語のデータはごくわずかで、主に英語であるため、正確性、データセキュリティ、ビジネスニーズへの適合性を確保することが困難である。
例えば、大規模な外国語モデルは数千億のパラメータを持ちます。現実世界のモデルを実行するには膨大な計算インフラが必要ですが、AIモデルは特に歴史知識、文化、各国特有の問題などにおいて誤った回答を出す可能性があるため、品質はそれに見合ったものではありません。
このため、VinBigdataは、データのセキュリティ確保、精度向上、コスト削減、そしてベトナム国内の状況への適応を目的として、ベトナム語で大規模な言語モデルを構築することを決定しました。専門家チームは、chatGPTよりも数百倍少ないパラメータ数でモデルを構築しましたが、そのモデルはベトナム人の膨大なデータに基づいて構築されました。
このモデルは、地域特有の質問に高い精度で回答できます。具体的には、2つの異なる違反行為について質問された際、chatGPTモデルは同じ回答と大まかな内容を示しました。一方、ベトナムのデータを用いたAIモデルは、法律、法令、罰金、情報源など、非常に具体的な情報に基づいて正確な回答をすることができます。
この正確さを証明するために、ダオ・ドゥック・ミン博士は、ベトナム文学の作品『乞食の妻』についてchatGPTとVinBigdataが開発したベトナム語モデルに質問した際、VinBigdataのモデルの結果は完全に正確であったのに対し、ChatGPTの答えは不明瞭だったという例を挙げました。
VinBigdataの代表者はまた、国内で生成されたAIを習得することは、政府がコンテンツを習得し、誤情報を回避し、国家のデータセキュリティを確保し、ベトナムの技術を世界に広めるのに役立つため重要であると述べた。
[広告2]
ソース
コメント (0)