12月5日と6日に開催された「AI - 現実の再構築」をテーマとした2023年人工知能デーのイベントで、VinAI人工知能研究応用会社( Vingroup )は、ベトナム語専用の大規模言語モデルに関するオープンソースの研究プロジェクト「PhoGPT」を発表した。
PhoGPTは、OpenAIのChatGPTのようなプロプライエタリソフトウェアとは異なり、オープンソースプロジェクトです。オープンソースであるため、商用利用に関する制限はなく、あらゆる関係者がPhoGPTを使用して、商用目的を含む独自のアプリケーションを開発できます。つまり、PhoGPTは、国内のAI関連アプリケーション開発コミュニティのためのプラットフォームと言えるでしょう。
VinAI人工知能研究開発会社のブイ・ハイ・フン社長によると、既存のベトナム語モデルの限界は、最適な性能を発揮できていないことと、オープンソースのコードベースが不足していることにあるという。そのため、AIコミュニティ全体、特に自然言語処理(NLP)コミュニティが直面する喫緊の課題の一つは、ベトナム語を高精度かつ効率的に処理できる、より強力な新しいモデルを構築することである。
AI専門家は、Transformerデコーディングプラットフォーム上に構築された75億個のパラメータを含むビッグデータ言語モデルは、Flash AttentionやAliBiコンテキスト長外挿などの最先端の技術を用いてゼロからトレーニングされたものだと考えている。
これらの技術は、モデルが文脈をより深く理解するのに役立つだけでなく、PhoGPTが自然な対話やインタラクションを行う能力も向上させます。これにより、PhoGPTはユーザーの多様な言語ニーズに対応できる、汎用性と柔軟性に優れたツールとなります。
ブイ・ハイ・フン博士は、PhoGPTは世界中の他のどのモデルとも独立して、同社がゼロから開発したと付け加えた。オープンソースモデルを採用しているため、ベトナムのコミュニティはPhoGPTを利用し、さらに改良することができる。PhoGPTのソースコードを一般公開し、ユーザーが容易にアクセスできるようにすることで、ユーザーが独自のカスタマイズされたアプリケーションを開発できる環境とコミュニティが生まれる。
オープンソースの目標の一つは、人々が同じことを繰り返す必要のないプラットフォームを構築し、組織がPhoGPT大規模言語モデルをさらに発展させられるようにすることです。これにより、ベトナム語大規模言語モデルのための質の高いオープンソースコミュニティが社会に形成され、多くの企業が参加して様々な分野に応用できるという好影響が生まれます。VinAI人工知能研究開発会社は、PhoGPTを用いて、医療や教育などの分野において、ベトナム語で個人ユーザー向けのアプリケーションや企業向けの包括的なサポートソリューションの研究開発を行う計画だと述べています。
PhoGPTは、高性能なベトナム語モデルの開発に向けた最初の基盤を築き、2030年までの政府のAI開発戦略に沿った、実用的で効果的なアプリケーションを開発するための土台となっている。
バ・タン
ソース






コメント (0)