これは、VinBigdataの最高製品責任者(CPO)であるグエン・キム・アン氏が、8月21日に同社が開発に成功したと発表したベトナム語モデルについてVietNamNetに語ったものです。VietNamNetでは、このインタビューの内容を読者の皆様にお送りします。
ベトナムにおけるAIの現在の応用について教えてください。
グエン・キム・アン氏: AIは近年、世界で最も注目を集めているキーワードの一つです。ベトナムでも、様々なフォーラムでこのテーマについて議論してきました。しかしながら、現実には、ベトナムにおけるAIの導入は、リソース、インフラ、専門人材の不足など、依然として多くの課題に直面しています。
2022年版人工知能(AI)準備指数レポートによると、ベトナムは世界55位、シンガポールは2位、マレーシアは29位、タイは31位となっています。ベトナムはAIの研究と応用の推進において、依然として更なる努力が必要であることが分かります。
ベトナムには数学と工学の基礎が非常にしっかりした若い労働力があり、そのため、近道を進むことで多くのメリットが得られると考えています。これは、私たちが活用すべき大きな強みです。政府と企業の支援と協力があれば、AI産業の発展の可能性をすぐに掴み、国の社会経済発展に貢献できると確信しています。
VinBigdata が最近リリースしたベトナム語言語モデルの開発を決定したのはなぜですか?
グエン・キム・アン氏:大規模言語モデルは、Open AIのChatGPTやGoogleのBardといったAIベースの製品開発における強固な基盤となります。しかし、海外の製品の場合、ベトナム語はコア言語グループに含まれていません。これは、ユーザーに返されるコンテンツの品質にある程度影響を与えます。
ベトナム人特有の詳細な情報を求める場合、誤りが生じる可能性が非常に高くなります。さらに深刻なのは、ユーザーがこのツールを使って情報を検索したりニュースを更新したりすると、将来的にベトナム人、特に若者の一部が誤った基礎知識を持つといった事態につながる可能性があることです。
したがって、ベトナム人のニーズに最大限応え、適切な製品を開発するには、大規模なベトナム語モデルの構築が不可欠です。VinBigdataは創業当初から、「データ」こそが市場ニーズに応えるAI製品の研究とリリースにおける中核かつ最も重要な要素であると認識してきました。
これこそが、私たちがベトナム語の大規模言語モデル構築をいち早く完了させる先駆者となる理由でもあります。ChatGPTのように1750億ものパラメータを用いる必要はなく、数十億のパラメータで済みます。これは応用面だけでなく、学習、仕事、情報検索などのツールとして生成AIを利用する人が増えるというトレンドにおいて、社会全体にとっても大きな意味を持ちます。
新しく発表されたベトナム語モデルを、VinBigdata はどのように適用するのでしょうか?
Nguyen Kim Anh 氏:技術を完全に習得し、最初のステップから自社開発し、大規模なベトナム語モデルの構築に成功したことは、VinBigdata が生成 AI 技術を市場に提供されている、または提供されている製品とサービスのエコシステムに導入する上で重要なステップだと考えています。
研究成果を実用化するための具体的なロードマップを策定しました。具体的には、VinBigdataは、企業向けとコミュニティ向けの2つのバージョンのアプリケーションを消費者に提供します。
エンタープライズ バージョンでは、VinBigdata はテクノロジを統合して、VinBase (包括的なマルチ認知人工知能プラットフォーム) をベトナム初の生成 AI プラットフォームにするとともに、生成 AI チャットボット、コールボット、新世代の ViVi 仮想アシスタントなどの生成 AI テクノロジに基づく開発ソリューションを提供します...
この技術は、機械によるコミュニケーションの自然さを高めるとともに、ユーザーがこれまでよりもはるかに迅速かつ簡単に情報を検索および統合できるようにサポートします。
現在、VinBigdataは、VinBase KB製品ライン(VinBaseナレッジベースポータル)に新技術を初めて適用することに成功しました。この製品は、ナレッジシステム内の膨大なデータセットから収集された情報に基づき、情報を取得し、自動的に回答を生成する機能を備えています。
VinBigdataは、2023年12月末までにViGPT製品(「ChatGPTのベトナム語版」)をリリースする予定です。コミュニティの皆様には、完全に無料でアクセスおよびテストしていただけます。ViGPTを利用することで、ユーザーはベトナム特有の情報(規制、法的文書など)や特定の性質の情報(歴史、地理、文学など)について質問したり、回答したりすることができます。
これはコミュニティと社会にとって非常に意義のあるプロジェクトであり、ベトナム人の学習と就労を効果的にサポートする便利なツールになることが期待されています。
VinBigdata はこの大規模なベトナム語モデルを関係者と共有する予定ですか?
グエン・キム・アン氏:大規模なベトナム語モデルの構築成功は、VinBigdataにとってだけでなく、ベトナムの社会と科学技術コミュニティにとっても意義深いものです。VinBaseプラットフォームは生成AIと統合されており、企業はこのコアテクノロジーを最大限に活用し、自社ブランド製品に適用することができます。
VinBigdata は、このモデルにより、ベトナムの企業が AI 技術にアクセスして、当社が開発したベトナム語モデルから成果を生み出したり継承したりする機会が増えることを期待しています。
さらに、ViGPT を使用すると、ベトナム人も独自の「ベトナム語版 ChatGPT」を持つことができ、そこから情報ソースを迅速かつ正確に、確実に簡単に検索できるようになります。
生成AIの開発においては、セキュリティと著作権が重要な要素となります。新たにリリースされたベトナム語モデルにおいて、VinBigdataはこの問題にどのように対処しましたか?
グエン・キム・アン氏:ビッグデータと人工知能の研究機関として、VinBigdataは厳格なプロセスの開発とデータセキュリティ規制の徹底的な遵守を通じて、常にデータの機密性を尊重しています。特にユーザーの権利を守るため、VinBigdataはデータの収集と利用、特に個人所有データの収集と利用のプロセスにおける透明性の確保に努めています。
同時に、情報漏洩を防ぐため、多層的なセキュリティ対策、厳格なデータライフサイクル管理プロセス、適切なデータ利用権限(誰がどのデータにアクセスし、どのデータを使用する権限を持つか)の構築に常に積極的に取り組んでいます。また、世界およびベトナムにはデータセキュリティに関する規制や標準があり、VinBigdataは常にこれらの原則を遵守しています。
さらに、近年のAI生成技術の急速な発展に伴い、著作権問題も非常に深刻な問題となっています。VinBigdataはこの点を認識し、誤情報を避けるために情報を拡散するのではなく、各分野においてベトナム特有のローカライズされた具体的な情報を提供することに注力しています。
この初期の方向性のおかげで、VinBigdata は、金融や銀行、法律、医学などの特定の専門分野や、歴史、地理、文学などのベトナム固有の情報に関して、ChatGPT よりも正確な知識を提供する製品を自信を持って作成できます。
あなたの意見では、ベトナムで AI を実際に適用する時期が来ているのでしょうか?
グエン・キム・アイン氏:人工知能(AI)の競争をさらに加速させる必要があると思います。世界の主要国や企業は、すでに私たちよりかなり先を進んでいるからです。
現時点では、ベトナムではAIの実践はあまり進んでおらず、まだ初期段階にあると言えます。
しかし、私は、各レベルの努力と協力、そして今日のベトナムの優秀なAI人材を組み合わせることで、飛躍のチャンスをつかむことができると信じています。
[広告2]
ソース
コメント (0)