これは、VinBigdataの最高製品責任者(CPO)であるグエン・キム・アン氏が、8月21日に同社が開発に成功したと発表したベトナム語モデルについてVietNamNetに語ったものです。VietNamNetでは、このインタビューの内容を読者の皆様にお送りします。
ベトナムにおけるAIの現在の応用について教えてください。
グエン・キム・アン氏: AIは近年、世界で最も人気のあるキーワードの1つです。ベトナムでも、さまざまなフォーラムでこのテーマについて議論してきました。しかし、現実には、ベトナムにおける AI の導入は、リソース、インフラ、専門人材などの制限など、依然として多くの課題に直面しています。
2022年人工知能(AI)準備指数レポートによると、ベトナムは世界55位、シンガポールは2位、マレーシアは29位、タイは31位にランクされています。ベトナムはAIの研究と応用の推進にさらに力を入れる必要があることがわかります。
ベトナムには数学と工学の基礎が非常にしっかりした若い労働力があるので、近道をとることで多くの利点が得られると思います。これは把握すべき大きな利点です。政府と企業の支援と協力により、AI産業の発展の可能性をすぐに掴み、国の社会経済発展に貢献できると信じています。
VinBigdata が最近リリースしたベトナム語言語モデルの開発を決定したのはなぜですか?
Nguyen Kim Anh 氏:大規模言語モデルは、Open AI の ChatGPT や Google の Bard などの AI アプリケーション製品の誕生の強固な基盤です。しかし、海外製品の場合、ベトナム語はコア言語グループに含まれません。これは、ユーザーに返されるコンテンツの品質に多かれ少なかれ影響します。
ベトナム人特有の詳しい情報を尋ねると、間違いが起こる可能性がかなり高くなります。さらに深刻なのは、ユーザーがこのツールを使って情報を検索したりニュースを更新したりすると、将来的にベトナム人の一部、特に若者の基礎知識を歪めるといった結果につながる可能性があることです。
したがって、適切な製品を開発し、ベトナム人のニーズに最大限に応えるためには、大規模なベトナム語モデルを構築する必要があります。 VinBigdata は設立当初から、市場に役立つ AI 製品の研究開発と発売において「データ」が中核かつ最も重要な要素であると認識してきました。
これは、私たちがベトナム語の大規模な言語モデルの構築をいち早く完了できる理由でもあります。 ChatGPT のように最大 1750 億個のパラメータを使用する代わりに、数十億個のパラメータのみが必要です。これは、応用面で意味があるだけでなく、ますます多くの人々が学習、仕事、情報の検索などのツールとして人工 AI を使用する傾向にある中で、社会的にも意味があります。
新しく発表されたベトナム語モデルを、VinBigdata はどのように適用するのでしょうか?
Nguyen Kim Anh 氏:技術を完全に習得し、最初のステップから自社開発し、大規模なベトナム語モデルの構築に成功したことは、VinBigdata が生成 AI 技術を市場に提供されている、または提供されている製品とサービスのエコシステムに導入する上で重要なステップだと考えています。
研究成果を実践に移すための具体的なロードマップを策定しました。具体的には、VinBigdata は消費者向けにアプリケーションの 2 つのバージョンを導入します。1 つは企業向け、もう 1 つはコミュニティ向けです。
エンタープライズ バージョンでは、VinBigdata はテクノロジを統合して、VinBase (包括的なマルチ認知人工知能プラットフォーム) をベトナム初の生成 AI プラットフォームにするとともに、生成 AI チャットボット、コールボット、新世代の ViVi 仮想アシスタントなどの生成 AI テクノロジに基づく開発ソリューションを提供します...
この技術は、機械によるコミュニケーションの自然さを高めるとともに、ユーザーがこれまでよりもはるかに迅速かつ簡単に情報を検索および統合できるようにサポートします。
現在、VinBigdata は VinBase KB 製品ライン (VinBase ナレッジ ベース ポータル) に新しいテクノロジを初めて適用することに成功しました。この製品は、ナレッジ システム内の非常に大規模なデータ セットから収集された情報に基づいて、情報を取得し、自動的に回答を生成する機能を備えています。
私たちの計画によれば、2023年12月末までに、VinBigdataはViGPT製品「ChatGPTのベトナム語版」をリリースし、コミュニティが完全に無料でアクセスしてテストできるようにします。 ViGPT を使用すると、ユーザーはベトナム特有の情報 (規制、法的文書など) や特定の性質の情報 (歴史、地理、文学など) について質問したり、回答したりできます。
これはコミュニティと社会にとって非常に意義のあるプロジェクトであり、ベトナム人の学習と就労を効果的にサポートする便利なツールになることが期待されています。
VinBigdata はこの大規模なベトナム語モデルを関係者と共有するつもりですか?
Nguyen Kim Anh氏:大規模なベトナム語モデルの構築が成功したことは、VinBigdataにとって意義深いだけでなく、ベトナムの社会や科学技術コミュニティにとっても意義深いことです。 VinBase プラットフォームは生成 AI と統合されており、企業はこのコアテクノロジーを最大限に活用して自社ブランド製品に適用できます。
VinBigdata は、このモデルにより、ベトナムの企業が AI 技術にアクセスして、当社が開発したベトナム語モデルから成果を生み出したり継承したりする機会が増えることを期待しています。
さらに、ViGPT を使用すると、ベトナム人も独自の「ベトナム語版 ChatGPT」を持つことができ、そこから情報ソースを迅速かつ正確に、確実に簡単に検索できるようになります。
生成 AI を開発する際には、セキュリティと著作権が重要な要素となります。新しくリリースされたベトナム語モデルに関して、VinBigdata はこの問題をどのように処理しましたか?
グエン・キム・アン氏:ビッグデータと人工知能の研究部門として、VinBigdata は厳格なプロセスを構築し、データ セキュリティ規制を厳格に遵守することで、常にデータ セキュリティを尊重しています。具体的には、ユーザーの権利を保証するために、VinBigdata は、特に個人が所有するデータに関して、データの収集と使用のプロセスに透明性を持たせるよう努めています。
同時に、当社は情報漏洩を防ぐために、多層的なセキュリティ対策、厳格なデータライフサイクル管理プロセス、適切なデータ使用権限(誰がどのデータにアクセスし、使用する権限を持っているか)を常に積極的に構築しています。世界とベトナムにはデータセキュリティに関する規制と標準があり、VinBigdata は常にこれらの原則に準拠しています。
さらに、最近の人工知能の目覚ましい発展により、著作権問題も非常に悩ましい話題となっています。これを理解し、VinBigdata は、誤情報を避けるために情報を広めるのではなく、各特定分野において、具体的でローカライズされたベトナム固有の情報を提供する方向で製品の開発に重点を置いています。
この初期の方向性のおかげで、VinBigdata は、金融や銀行、法律、医学などの特定の専門分野や、歴史、地理、文学などのベトナム固有の情報に関して、ChatGPT よりも正確な知識を提供する製品を自信を持って作成できます。
あなたの意見では、ベトナムで AI を実際に適用する時期が来ているのでしょうか?
グエン・キム・アン氏:人工知能の競争をさらに加速させる必要があると思います。なぜなら、世界の主要国や大企業は、すでに私たちよりかなり先を行っているからです。
現時点では、ベトナムではAIの実践はあまり進んでおらず、まだ初期段階にあると言えます。
しかし、私は、各レベルの努力と協力、そして今日のベトナムの優秀なAI人材を組み合わせることで、飛躍のチャンスをつかむことができると信じています。
[広告2]
ソース
コメント (0)