VinBigdataは8月21日、大規模なベトナム語モデルの構築に成功したと発表し、生成AI技術を習得するための基盤を構築した。
大規模言語モデル(LLM)は、膨大なテキストまたは画像データセットを用いてディープラーニング技術を用いて学習されたモデルです。これらのモデルは、知識の理解、テキスト生成、そして様々な自然言語処理タスクの実行が可能です。LLMは、テキスト、画像、音声など、様々な形式から新しいコンテンツやアイデアを生成できる生成型AI技術の開発の鍵となると考えられています。
大規模なベトナム語モデルの構築に成功したことで、VinBigdataは技術を統合し、VinBase(総合的なマルチ認知人工知能プラットフォーム)をベトナムの生成AIプラットフォームにするとともに、この技術に基づいた生成AIチャットボット、コールボット、新世代のViVi仮想アシスタントなど開発ソリューションを提供します。この技術は、機械によるコミュニケーションの自然さを高めるとともに、ユーザーが以前よりも迅速かつ簡単に情報を検索および統合することをサポートします。
ヴー・ハ・ヴァン教授 - VinBigdata社の科学ディレクター。写真: VinBigdata
VinBigdata社の科学部長であるヴー・ハ・ヴァン教授は、世界ではOpenAIのChatGPTやGoogleのBardなど、大規模言語モデルに基づく製品の研究と発売に成功した大企業が数多く存在すると述べた。ベトナムでは、VinBigdata はVingroupからの投資を受け、大規模なベトナム語モデルを構築している。ヴァン教授によると、このモデルは精度の向上、インフラコストの削減、セキュリティの確保という3つの主要な課題の解決に重点を置いているという。
「ChatGPTのように約1750億のパラメータを必要とする代わりに、VinBigdataは数十億のパラメータを持つ大規模な言語モデルを作成しながら、ベトナム語のデータとベトナム語の知識に焦点を当てた非常に真正な文書を生成する能力を備えています」とユニットのリーダーは述べた。
技術の習得、初期段階からの自己開発、そして大規模なベトナム語モデルの構築は、VinBigdataが生成AI技術を市場の製品・サービスのエコシステムに導入するための一歩と捉えられています。現在、同社は新技術をVinBase KB製品ライン(VinBaseナレッジベースポータル)に初めて適用しています。この製品は、ナレッジシステム内の膨大なデータセットから収集された情報に基づき、情報を取得し、自動的に回答を生成する機能を備えています。
VinBigdataの代表者がGenerative AIを発表するイベントで語った。写真: VinBigdata
Vingroupのメンバー企業は、今年12月にVinBase2.0とViGPTアプリケーションという2つの主要製品ラインをリリースする予定です。VinBase 2.0は、企業や政府機関向けのソリューションで多様な認識を生み出すAIプラットフォームです。一方、ViGPTアプリケーションは「ChatGPTのベトナム版」としてVingroupによって導入され、コミュニティがアクセスしてテストすることができます。ViGPTを使用すると、ユーザーはベトナムに関する特定の情報(規制、法的文書)や地域情報(歴史、文学、景勝地、特産品)について質問したり、回答したりできます。
VinBigdata Joint Stock Companyは、最大3,500テラバイトのデータベースシステムを保有しています。このシステムには、数十万時間分の音声データ、画像、情報などが蓄積されており、これらはクリーニング、処理、分類され、AIトレーニングに活用されています。また、研究開発インフラも整備されています。このインフラには、数十基のNvidiaDGX A100サーバークラスターが含まれています。同社はまた、ベトナム人の教授、科学者、そして世界中から集まった技術専門家からなるチームを擁しています。
ホアイ・フオン
[広告2]
ソースリンク
コメント (0)