RRCのDocVQAカテゴリーにおけるランキング(2025年6月)。
ベトナムにおける急速なデジタル変革と人工知能の導入が進む中、OCR(光学文字認識)技術は、文書のデジタル化、業務プロセスの自動化、コスト削減、管理効率の向上においてますます重要な役割を果たしています。しかし、ベトナム語特有のアクセントや手書き文字といった特性を考慮すると、文字認識の問題は単に文字を「読む」だけにとどまらず、文脈を包括的に理解できるモデルが必要となります。
最近、 CMC応用技術研究所(CMC ATI)は、大規模な5TBのデータウェアハウスから研究チームが開発したCATI-VLM(Visual Document Understanding)モデルが、多くの国際的な競合製品を凌駕し、2025年6月にRobust Reading Competition(RRC)が発表した文書視覚質問応答(DocVQA)カテゴリーのランキングで世界トップ12、ベトナム国内トップ1にランクインしたことを発表しました。
Robust Reading Competition (RRC) は、スペインのバルセロナ自治大学 (UAB) のコンピュータビジョンセンター (CVC) が主催する権威ある科学コンテストです (https://rrc.cvc.uab.es/)。UAB は、コンピュータビジョンの分野で世界的に有名な研究機関です。
2011年に開始されたこのコンテストは、コンピュータビジョン分野における世界有数のフォーラムである国際テキスト解析認識会議(ICDAR)の一環として毎年開催されています。このコンテストには、大学、研究機関、そして清華大学、現代自動車グループ、テンセントといった大手テクノロジー企業から多数の研究者やエンジニアが参加しています。RRCの問題は、翻訳や企業データ管理から都市分析、歴史文書処理に至るまで、幅広い実用的な問題と密接に関連しており、技術進歩を促進するように設計されています。
CMC ATI所長のダン・ミン・トゥアン博士は次のように述べています。「CMCチームの研究能力が、RRCのような権威ある国際コンペティションで認められたことを大変嬉しく思います。短期間で高い評価を得た研究チームは、先進国の主要機関と肩を並べる国際競争力を証明しました。さらに重要なのは、これはベトナム語やベトナムの専門分野に関連する具体的な問題を解決するための技術を習得する私たちの能力を明確に示す証拠であるということです。」
CMC ATIディレクター、ダン・ミン・トゥアン博士。
CATI-VLMは、従来のOCRとは異なり、文字を抽出するだけでなく、テキストコンテンツ、非テキスト要素(チェックボックス、グラフ、署名、数式)、レイアウト(ページ構造、表、フォーム)、スタイル(フォント、ハイライトなど)といった複数の情報層を理解できます。ChatGPTと同様に、個々のフォームを事前に学習する必要なく、文書画像上で提示された視覚的な質問に答えることができます。
特筆すべきは、RRCランキングにおいて、わずか30億個のパラメータを持つCATI-VLMが、7つのデータセットのうち4つで最高の精度を達成し、Deepseek(270億個のパラメータ)、GPT-4 Vision Turbo + Amazon Textract OCR(上位34位)、Baidu(上位22位)といった多くの大手テクノロジー企業のモデルを凌駕したことである。
この成果はまた、拡張性というパラメータを追い求めるのではなく、コア技術の習得とベトナムのインフラ状況に合わせたモデルの最適化に重点を置いた、実践的なアプローチを示している。
大学入学願書の例
上記の画像に写っている筆跡から、テキストが特定されました。
CMCテクノロジーグループの取締役会長兼執行会長であるグエン・チュン・チン氏は、「これは、10年以上にわたる技術研究開発(R&D)への継続的な投資の成果です。国際的な技術分野におけるCMCの高い実績は、ベトナムの技術を習得するという当社の戦略と、AIへの変革およびグローバル市場への進出という当社の方向性を裏付けるものです。ベトナムの知能は、世界の巨大テクノロジー企業と十分に競争できる能力を持ち、世界の技術地図上で確固たる地位を築くことができると確信しています」と強調しました。
CATI-VLMは、C.OpenAIの製品エコシステムに適用され、具体的には、法律文書をレビューするための仮想アシスタントであるCLS、デジタル文書変換プラットフォームであるCMC SmartDoc、スマートオフィス向けの自動レポートシステムであるCMC KMS知識管理システム、そして次世代のエージェント文書アプリケーションなどが含まれます。
クアン・フイ
出典:https://nhandan.vn/cmc-dat-top-12-the-gioi-ve-nhan-dang-van-ban-post891252.html






コメント (0)