v7 インターフェース、AI 統合キーボード。写真: NVCC . |
Tri Thuc - Znewsとのインタビューで、Tri Duc (2003年生まれ)は、人工知能を適用してベトナム語の入力方法を変えるというアイデアについて語りました。学生のプロジェクト「v7」は現在、研究論文へと発展し、AIに関する権威ある会議であるIJCAI 2025に採択されました。
数十年にわたって人気があるにもかかわらず、Telex または VNI 入力には、ユーザー エクスペリエンスの面で依然として多くの制限があります。そこから、軽量の予測ツールとなるv7が誕生し、AI統合によりベトナム語の入力時間を短縮できるようになりました。
言語とテクノロジーへの情熱
言語とテクノロジーに対する彼の愛情により、彼はホーチミン市工科大学で応用人工知能を専攻しました。
学習中は、ベトナム語の大規模言語モデル (LLM)、少数民族言語を翻訳するためのソフトウェア、入学をサポートするチャットボットなどのプロジェクトに取り組みます。 「これらの経験は、確固たる知識の基盤を積み重ね、AIを応用してコミュニティに役立つ製品を作りたいという情熱と願望を育むのに役立ちました」と彼は語った。
Tri Duc は、AI を生活に応用することで価値を生み出したいと考えています。写真: NVCC。 |
さらに、北京語と広東語の知識を持つ Duc 氏は、ピンイン/ジュピンとベトナム語の綴りの相関関係を認識していました。この要素から、象形文字の複雑さとは対照的に、中国語のピンイン入力システムでは「yn」と入力するだけで国名を漢字で表記できることもわかります。一方、Telex や VNI では、「Vietnam」という単語を入力するのに 10 個のキーが必要です。
観察を通して、ドゥック氏は、人々が素早くコミュニケーションをとるとき、「student(学生)」を「hs」と発音するなど、最初の子音を残して省略することが多いことに気づきました。 「人間がこの種の文章を簡単に理解できるのであれば、適切なデータで訓練すればAIも絶対に理解できる」と彼はこのアイデアが生まれた状況について語った。
補助メカニズムを使用する Telex や VNI などの従来の入力ツールを使用する場合、文字全体を入力してからアクセントを追加する代わりに、v7 では AI を使用して、入力する単語を提案します。この技術は、できるだけ少ないキーで完全な単語を正確に予測します。
ベトナム語の綴りの構造では、単語は語頭の子音、韻、声調で構成されます。たとえば、「Nguyen」という単語は、「ng」、「uyen」、下降音から構成されています。この原則に基づいて、v7 は最初の子音と声調のみを使用して単語全体を予測するように構築されており、精度を維持しながらキー入力の数を大幅に削減します。
AIにベトナム語を教える課題
Duc氏によると、最大の難しさは、この入力ツールを提供するためにAIにベトナム語を「理解」するように教えることだという。彼は、優れたコンテキスト理解と正確な単語予測を実現する Transformers アーキテクチャを備えた GPT-2 を基盤として選択する前に、多くのモデルを試しました。
基盤となるアーキテクチャを選択した後、Duc 氏は Tokenizer (語彙エンコーダー) を、自分で構築したベトナム語の語彙に完全に置き換えました。エンジニアは、ユーザーが書きたい単語を予測しながら包括的な処理が行えるよう、有効で正しい綴りのベトナム語の単語をすべて除外しました。
もうひとつの課題は、予測パフォーマンスと応答速度のバランスを取り、モデルがコンピューターとスマートフォンの両方でリアルタイムに実行でき、かつ最善の予測を行うのに十分な強力さを維持することです。 2 か月の継続的なテストを経て、現在のバージョンでは、ユーザーが入力したい単語の約 70% が、わずか 0.03 秒の遅延で上部に表示されるようになりました。
キーボードの入力方法については、Duc が言語学者 Cao Xuan Hao や Henri Maspero から得た多くの研究によると、ベトナム語には 6 つではなく 8 つの声調があるそうです。この機能を活用するために、v7 では通常の 6 トーンではなく 8 トーン システム (フラット トーンと 5 つのアクセント トーン (シャープ、フラット、アスク、フォーリング、ヘビー) を含む) が使用されています。このキーボードでは、「v7」と入力すると、モデルが「ベトナム語」という単語を提案します。これは製品名のアイデアでもあります。
ソーシャル ネットワークで v7 を共有した後、Duc 氏は、このモデルが注目され、サポートされ、体験したいという要望が寄せられたことに非常に嬉しく、驚いたと述べました。 「これにより、よりスマートで高速なベトナム語入力ツールの必要性をはっきりと認識しました」と彼は語った。
科学研究論文の著者のグループ。左から右へ: ニャット カン、ヒエウ ギア、トリ ドゥック。写真: NVCC。 |
現在、このキーボードはまだプロトタイプ段階にあり、GitHub でソース コードが公開されているため、プログラマーやテクノロジー ユーザーがテストして貢献することができます。一般ユーザーが簡単にインストールして使用できるように、Windows および macOS 用の完全なアプリケーション バージョンも開発されています。
今後、v7 の最優先事項は、iPhone のキーボード バージョンで、スマートフォンを使用してベトナム語のテキストを入力する方法を改善することです。さらに、日常会話データによるさらなるトレーニングによってモデルの精度が向上し、AIが一般的な文脈をよりよく理解できるようになります。
ドイツの歩みは、ベトナムがAIインフラに多額の投資をする中で、テクノロジーのトレンドに追いつき、創造的な風を吹き込むことに貢献しました。彼が誇らしく感じたのは、v7 が初めて完全な文章を作ったときでした。 「そうなれば、おそらく現在の ChatGPT の 1/10,000 程度の小さなモデルでも、人間のように考えることができるようになる」と Duc 氏は言う。
出典: https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html
コメント (0)