ベトナムは人工知能をめぐる競争のペースを加速させる必要がある。

[広告1]

上記の発言は、VinBigdataの最高製品責任者（CPO）であるグエン・キム・アン氏が、8月21日に同社が開発に成功したと発表したベトナム語ビッグランゲージモデルに関して、VietNamNetのインタビューで述べたものです。VietNamNetでは、このインタビューの内容を読者の皆様と共有いたします。

VinBigdata の最高製品責任者 (CPO)、Nguyen Kim Anh 氏。

ベトナムにおけるAI活用の現状について教えてください。

グエン・キム・アン氏： AIは近年、世界で最も注目を集めているキーワードの一つです。ベトナムでも、様々なフォーラムでこのテーマについて議論を重ねてきました。しかしながら、現実には、ベトナムにおけるAIの導入は、リソース、インフラ、専門人材の不足など、依然として多くの課題に直面しています。

2022年人工知能（AI）準備指数レポートによると、ベトナムは世界55位、シンガポールは2位、マレーシアは29位、タイは31位でした。これは、ベトナムがAIの研究と応用の促進において、より積極的な取り組みが必要なことを示しています。

ベトナムは数学と工学の非常に強固な基盤を持つ若い労働力を擁しており、飛躍的な発展を遂げる上で多くの優位性を持っていると考えています。これは私たちが活かすべき重要な強みです。政府と企業の支援と協力があれば、AI産業の発展の可能性を迅速に捉え、国の社会経済発展に貢献できると確信しています。

VinBigdata が最近リリースしたベトナム語のビッグデータモデルの開発を決定したのはなぜですか?

グエン・キム・アン氏：大規模言語モデルは、Open AIのChatGPTやGoogleのBardといったAI生成アプリケーションの開発において強固な基盤となります。しかし、海外の製品の場合、ベトナム語はコア言語に含まれていません。これは、ユーザーに提供されるコンテンツの品質にある程度影響を与えます。

ベトナム人に特有の詳細な情報を求めると、誤りが生じる可能性が非常に高くなります。さらに深刻なことに、ユーザーがこのツールを使って情報を検索したりニュースを更新したりすると、将来的にベトナム人の一部、特に若者の基礎知識が歪められるなど、悪影響が生じる可能性があります。

したがって、ベトナム人のニーズに最適な製品を開発するには、大規模なベトナム語モデルの構築が不可欠です。VinBigdataは創業以来、「データ」を市場ニーズに応えるAI製品の研究とリリースにおける中核かつ最も重要な要素と位置付けています。

これが、私たちがベトナム語の大規模言語モデル構築を他社に先駆けて早期に完了できた理由でもあります。ChatGPTのように1750億ものパラメータを用いる代わりに、数十億のパラメータしか必要としませんでした。これは応用面で重要であるだけでなく、AI生成を学習、仕事、情報検索のツールとして利用する人が増えていることからも、社会的な意義も大きいと言えます。

最近発表されたベトナム語のビッグ言語モデルを、VinBigdata はどのように適用するのでしょうか?

グエン・キム・アン氏：技術を完全に制御し、ゼロから開発し、大規模なベトナム語モデルの構築に成功したことは大きな前進であり、VinBigdataがAI生成技術を市場に提供する製品とサービスのエコシステムに統合するのに役立ちます。

研究成果を実用化するための具体的なロードマップを策定しました。具体的には、VinBigdataは、まず企業向け、次にコミュニティ向けの2つのバージョンのアプリケーションを消費者に提供します。

VinBigdataは、エンタープライズ版で技術を統合し、VinBase（総合的なマルチ認知人工知能プラットフォーム）をベトナム初のAI生成プラットフォームにするとともに、生成AIチャットボット、コールボット、次世代ViVi仮想アシスタントなどのAI生成技術に基づく開発ソリューションも提供します。

この技術は、機械によるコミュニケーションの自然さを高めるとともに、ユーザーがこれまでよりもはるかに迅速かつ簡単に情報を検索および統合できるようにサポートします。

VinBigdataは、この新技術をまずVinBase KB（VinBaseナレッジベースポータル）製品ラインに適用することに成功しました。この製品は、ナレッジベース内の膨大なデータセットから収集されたデータに基づいて情報を取得し、自動的に回答を生成することができます。

大規模なベトナム語モデルの構築に成功したことは大きな前進とみなされ、VinBigdata は AI 生成テクノロジーを、すでに市場に提供されている製品とサービスのエコシステムに統合できるようになります。

計画では、VinBigdataは2023年12月末にViGPT（「ChatGPTのベトナム版」）をリリースし、コミュニティに完全に無料でアクセスとテストを提供します。ViGPTでは、ユーザーはベトナム特有の情報（規制、法的文書など）や、特定の特性（歴史、地理、文学など）に関する情報について質問したり、回答したりすることができます。

これは地域社会や社会にとって非常に意義のあるプロジェクトであり、ベトナム人の学習や仕事に力強い支援を提供する有用なツールとなることが期待されています。

VinBigdata はこのベトナム語大規模言語モデルを関係者と共有する予定ですか?

グエン・キム・アン氏：ベトナム語ビッグランゲージモデルの開発成功は、VinBigdataにとってだけでなく、ベトナムの社会や科学技術コミュニティにとっても意義深いものです。VinBaseプラットフォームはAI生成機能を統合しており、企業はこのコアテクノロジーを自社ブランド製品に最大限に活用することができます。

VinBigdataは、このモデルによって、ベトナムの企業が、当社が開発したベトナム語大規模言語モデルの成果を生成または継承するAI技術にアクセスする機会が増えることを期待しています。

さらに、ViGPT により、ベトナム人も独自の「ベトナム語版 ChatGPT」を利用できるようになるため、情報を迅速かつ正確に、確実に簡単に検索できるようになります。

ベトナム語のビッグ言語モデルは、ホーチミン市でのイベントで VinBigdata によって紹介されました。

セキュリティと著作権は、生成AIの開発において重要な要素です。最近リリースされたベトナム語ビッグランゲージモデルにおいて、VinBigdataはこの問題にどのように対処しましたか？

グエン・キム・アン氏：ビッグデータと人工知能を専門とする研究ユニットとして、VinBigdataは厳格なプロセスを構築し、データセキュリティ規制を厳格に遵守することで、常にデータセキュリティを尊重しています。特に、ユーザーの権利を守るため、VinBigdataはデータの収集と利用のプロセス、特に個人が所有するデータにおける透明性の確保に努めています。

同時に、情報漏洩を防止するため、多層的なセキュリティ対策、厳格なデータライフサイクル管理プロセス、適切なデータアクセス制御（誰がどのデータにアクセスし、どのデータを使用する権限を持っているか）を積極的に構築しています。世界的にもベトナムでも、データセキュリティに関する規制や基準があり、VinBigdataは常にこれらの原則を遵守しています。

さらに、近年のAIの急速な発展に伴い、著作権の問題はより厄介な問題となっています。VinBigdataはこの点を認識し、広範かつ一般的なアプローチではなく、ベトナム人や特定の分野に特化しており、ローカライズされた情報を提供する製品の開発に注力することで、誤情報の拡散を回避しています。

この初期の戦略的方向性のおかげで、VinBigdata は、金融や銀行、法律、医療などの専門分野や、歴史、地理、文学などのベトナム特有の情報において、ChatGPT よりも正確な知識を提供する製品を自信を持って作成できます。

彼によると、ベトナムがAIを実際に適用する時期が来ているのでしょうか?

グエン・キム・アン氏：人工知能（AI）の競争は、さらに加速する必要があると思います。なぜなら、世界中の国々や大企業は、すでに私たちよりかなり先行しているからです。

現時点では、ベトナムではAIが本格的に実践的に導入されておらず、まだ初期段階にあると言えます。

しかし、あらゆるレベルの協調的な努力と、現在ベトナムで利用可能な高品質の AI 労働力を組み合わせることで、飛躍的な進歩を遂げるチャンスをつかむことができると信じています。

[広告2]
ソース