VinBigdataは8月21日、大規模なベトナム語モデルの構築に成功したと発表し、生成AI技術を習得するための基盤を構築した。
大規模言語モデル(LLM)は、膨大なテキストや画像セットを用いてディープラーニング技術を用いて学習されたモデルです。これらのモデルは、知識の理解、テキスト生成、そして様々な自然言語処理タスクの実行が可能です。LLMは、テキスト、画像、音声など、様々な形式によって新しいコンテンツやアイデアを生成できる生成型AI技術の開発の鍵となると考えられています。
大規模なベトナム語モデルの構築に成功したことで、VinBigdataは技術を統合し、VinBase(総合的なマルチ認知人工知能プラットフォーム)をベトナムの生成AIプラットフォームにするとともに、この技術に基づいた生成AIチャットボット、コールボット、新世代のViVi仮想アシスタントなど開発ソリューションを提供します。この技術は、機械によるコミュニケーションの自然さを高めるとともに、ユーザーが以前よりも迅速かつ簡単に情報を検索および統合することをサポートします。
ヴー・ハ・ヴァン教授 - VinBigdata社の科学ディレクター。写真: VinBigdata
VinBigdata社の科学ディレクターであるヴー・ハ・ヴァン教授は、世界ではOpenAIのChatGPTやGoogleのBardなど、大規模言語モデルに基づく製品の研究と発売に成功した大企業が数多く存在すると述べました。ベトナムでは、VinBigdata はVingroupからの投資を受け、大規模なベトナム語モデルを構築しています。ヴァン教授によると、このモデルは精度の向上、インフラコストの削減、セキュリティの確保という3つの主要な課題の解決に重点を置いています。
「ChatGPTのように約1750億のパラメータを必要とする代わりに、VinBigdataは数十億のパラメータを持つ大規模な言語モデルを作成しながら、ベトナム語のデータとベトナム語の知識に焦点を当てた非常に真正な文書を生成する能力を備えています」とユニットのリーダーは述べた。
技術を習得し、初期段階から自社開発を行い、大規模なベトナム語モデルを構築することは、VinBigdataが生成AI技術を市場の製品・サービスのエコシステムに導入するための一歩と捉えられています。現在、同社は新技術をVinBase KB製品ライン(VinBaseナレッジベースポータル)に初めて適用しています。この製品は、ナレッジシステム内の非常に大規模なデータセットから収集された情報に基づいて、情報を取得し、自動的に回答を生成する機能を備えています。
VinBigdataの代表者がイベントで生成AIを発表した。写真: VinBigdata
今年12月には、Vingroupのメンバー企業が2つの主要製品ライン、VinBase2.0とViGPTアプリケーションをリリースする予定です。VinBase 2.0は、企業や政府機関向けのソリューションで多様な認識を生み出すAIプラットフォームです。一方、ViGPTアプリケーションは「ChatGPTのベトナム版」としてVingroupによって導入され、コミュニティがアクセスしてテストすることができます。ViGPTを使用すると、ユーザーはベトナムの特定の情報(規制、法的文書)や地域情報(歴史、文学、景勝地、特産品)について質問したり、回答したりすることができます。
VinBigdata Joint Stock Companyは、最大3,500テラバイトのデータベースシステムを保有しています。このシステムには、数十万時間分の音声データ、画像、情報などが蓄積されており、これらはクリーニング、処理、分類され、AIトレーニングおよび研究開発インフラに活用されています。このインフラには、数十基のNvidiaDGX A100サーバークラスターが含まれています。また、同社はベトナム人教授、科学者、そして世界中から集まった技術専門家からなるチームを擁しています。
ホアイ・フオン
[広告2]
ソースリンク
コメント (0)