上記の内容は、最近の ViGPT 発表イベントの傍らで行われた記者とのディスカッションの中で、VinBigdata の科学ディレクターである Vu Ha Van 教授によって語られたものです。
ViGPTは技術者とコミュニティからの貢献を必要としています
ヴー・ハ・ヴァン教授は、Googleのような大企業が大規模な言語を開発する際には、英語かフランス語を主要言語として選択するだろうと述べた。ベトナム語もあるが、検索結果の表示は他の言語に比べて遅くなる。これらの大規模言語モデルは、ベトナム語からの質問に対して、ある程度、完全かつ正確な回答を提供できないだろう。
そのため、VinBigdataは、時間の経過とともに、ViGPTがベトナム人の文化、歴史、地理など、ベトナム人の特徴や特性に関する情報に直接関連する質問において、精度においてViGPTを上回ることを期待しています。これは、ベトナム語モデルを作成した人々がベトナム人に質問をする際に将来的に求め、目指すものであり、外国の言語モデルよりも優れた比較情報源となるでしょう。
さらに深く掘り下げると、VinBigdataのサイエンスディレクターは、例えば政治的に「デリケートな」時期にチュオン・サとホアン・サの歴史に関する質問を分析したところ、GoogleやOpenAIからの回答に、これらの企業の創設者やその背後にいる人々の政治的偏見が含まれていないことを保証することは非常に困難でした。ベトナムには他にも選択肢があるので、この問題について検討した方が良いでしょう。
「ベトナム人向けの大規模言語モデルを構築する私たちの目標は、ベトナム人に最善の答えを提供することです。私たちは彼らの目的を知ることはできません」と、ヴー・ハ・ヴァン教授は語った。
ViGPTはChatGPTやGoogle Bardほどの優れた機能がないことは認めている。これらの企業の投資率と実装に費やす時間は、彼らの数千倍にも及ぶからだ。しかし、Vu Ha Van教授は、「誰の国旗に6つの金色の文字が刺繍されているか?」といったベトナムに偏った質問では、ViGPTはTran Quoc Toanの国旗だと答える一方で、他のバージョンは間違っている可能性があると述べた。今後、このような詳細な質問では、国内ユーザーからのフィードバックがあれば、ViGPTはより良い結果を出すだろう。
「もしユーザーが批判ばかりしたり、10歳の子供が知らない質問を知っているのにこのビッグ言語モデルは相変わらず愚かだと考えたり、私たちがAIより賢いことを証明するためにひっかけ質問をしたりするなら、私たちはAIより賢いですが、それは何の目的もありません。私たちは製品をより良くするのではなく、製品を作る人々をより不幸にしているだけです。そのため、VinBigdataは技術者とコミュニティの共通の貢献を必要としています。製品を単なるサービスツールにとどまらず、ベトナム国民の誇りとなるよう、製品を完成させるためには、ベトナム国民の協力が必要です」と、Vu Ha Van教授は強調しました。
ベトナム語モデルをサポートし、伴走する準備が整いました
ベトナムでAIに取り組んでいるスタートアップ企業の代表者は、 VietNamNetの取材に対し、VinBigdataのベトナム語モデルをサポートし、協力する用意があると語った。
Aicontent.vnプラットフォームを所有するUnikon Joint Stock Companyの技術ディレクター、ディン・トラン・トゥアン・リン氏は、現在アジア諸国で大規模言語モデルの学習に成功している国は多くなく、中国、韓国、日本などがその先頭に立っていると述べています。そのため、ViGPTはベトナム国民のコア技術への投資努力にとって重要なシグナルとなります。ディン・トラン・トゥアン・リン氏は、「千里の道も一歩から」と述べています。AI応用のパイオニアとして、UnikonはViGPTへの貢献、テスト、フィードバックの提供、そして適切な規模のプロジェクトへの活用にも積極的に取り組んでいます。
一方、Lovinbotの共同創設者であるダン・フー・ソン氏は、VinBigdataがコミュニティや専門家の意見に耳を傾け、ベトナム人に特化した大規模な言語モデルを開発していることは、非常に良いことだと述べました。技術者であるダン・フー・ソン氏は、製品の使用後、VinBigdataの技術チームにフィードバックを提供しました。
ダン・フー・ソン氏によると、新しく発売された製品はすぐに完成するものではなく、コミュニティからの完全なサポートをすぐに得られるわけでもない。ベトナムの人々は長い間、その技術はベトナムには無理だと思っていたため、まだ時間が必要だ。同時に、VinBigdataはコミュニティがどのようにサポートし、より良い形で寄り添うことができるかについて、具体的な指示を出す必要がある。
Mindmaidプラットフォームの創設者であるダン・フー・ロック氏は、現在、母語モデルを構築できる国は世界的に非常に少ないと述べました。インドのような情報技術力の高い豊かな国や、インドネシアや中東のようにベトナムよりもGDPが高い国でさえも、言語特性に依存するため、単にやりたいからといって構築できるわけではありません。したがって、より広い視点から見ると、ベトナムは母語モデルの構築において戦略的優位性を持っており、これはベトナム人が世界で競争していく上での戦略的優位性となるでしょう。
ダン・フー・ロック氏によると、ベトナム語の大規模言語モデル構築に向けたあらゆる取り組みは価値があり、現状の欠点を理由に国内技術部門の努力をすべて否定するのではなく、モデルを日々より完成度の高いものにするために具体的な方法で論評する必要があるとのことです。ベトナム人も、ベトナム語の大規模言語モデルを現在世界最高の大規模言語モデルと比較するのではなく、AI時代における大規模言語技術の重要性を広く発信し、それをどのように応用して自国とベトナム企業に価値を生み出すかについて議論を深めるべきです。大規模言語は汎用的なAI技術であるため、この問題には不向きかもしれませんが、他の具体的な問題には適しています。特に、ベトナム語の理解と生成に関する問題では、ベトナム語の大規模言語モデルがより大きな優位性を持つでしょう。
[広告2]
ソース
コメント (0)