
先日、米国ハワイで開催された国際コンピュータビジョン会議(ICCV 2025)の枠組みの中で、AIシティチャレンジ2025(スマートシティにおけるAI)の結果発表式が開催されました。2024年の優勝に続き、今年はVNPTのAIエンジニアリングチームが「エッジデバイスにおける超広角カメラ画像データからの物体処理と認識(エッジAI)」部門で1位を獲得しました。この課題は、コンパクトなハードウェアデバイス上でリアルタイム処理速度を発揮するAIシステムと、歪んだ画像データからの物体認識において高い精度を確保し、実用的なニーズを満たすAIシステムを必要としています。
AI City Challenge 2025は、スマートシティにおける人工知能(AI)の応用に関する世界で最も権威のある年次コンテストの一つです。今年のコンテストは、例年よりも難易度の高い4つのカテゴリーで構成され、米国、中国、韓国、台湾など、AI開発が盛んな国々から3万以上のチームが参加しました。
VNPT のエンジニアリング チームは、エッジでの AI の精度と処理速度により、業界をリードしています。
エッジにおけるAI機能強化の課題
超広角カメラ画像データから物体を処理・認識する問題は、2024年からAIシティチャレンジに導入され、コンピュータービジョンを現在の交通監視システムに応用する潮流を反映しています。実用性も高く、このカテゴリーは常に大会全体で最も多くのチームを擁するレースとなっています。今年は、歪んだ画像や変形した画像を正確に処理するだけでなく、モデルがエッジデバイス上で効果的に動作するようにプロセス全体を最適化する必要があるため、難易度がさらに高まりました。
VNPT エンジニアリング チームは、車両を迅速かつ正確に識別するためにさまざまな技術を適用します。
チームは、データ収集ポイント(エッジデバイスと呼ばれる)に設置された小型デバイス「Jetson Orin」上で効率的に動作するようにモデルを最適化する必要がありました。Jetson Orinの電力制限は30Wで、中央サーバーよりもはるかに低い計算能力しかありませんでした。つまり、チームは過度に大きなモデルを使用することはできず、プログラムを合理化および最適化することで、より高速に実行し、消費リソースを削減しながらも、車両を正確に認識する必要がありました。これらの変更により、AI City Challenge 2025はこれまでで最も困難なシーズンの1つとなりました。特に、チームは昨年の経験から学び、競争レベルが大幅に向上したためです。
実際のモデル最適化の経験から恩恵を受ける
交通監視の問題では、コンピューティングインフラストラクチャとネットワーク接続が限られていることが多く、正確かつ効率的なAIモデルの開発が大きな課題となっています。これが、エッジAIが避けられないトレンドとなっている理由でもあります。すべてのデータを中央サーバーに送信して処理するのではなく、モデルを収集デバイス(カメラなど)に直接配置することで、特に大規模な監視システムにおいて、応答速度の向上、レイテンシの低減、帯域幅の節約、データセキュリティの確保に役立ちます。
AIシティチャレンジ2025で発表された結果によると、VNPTエンジニアリングチームは、世界中の大手テクノロジー企業、研究機関、大学の数百のチームを抑えて1位になりました。この成果は、観測エリアの拡大、死角の減少、設置デバイス数の削減、都市インフラ運用の効率化を目的とした超広角カメラの普及が進む同国の交通監視および都市セキュリティ向けAIエコシステムの強化に貢献します。VNPTエンジニアリングチームは、画像処理用AIモデルの開発と国内展開で7年以上の経験を持ち、精度、速度、運用コストのバランスをとる能力を蓄積してきました。これらは、AIを実際の環境に適用する有効性を左右する要素です。

VNPT チームは 40 を超える画像処理 AI モデルを開発し、習得しました。
現在、VNPTチームは、ナンバープレート認識、交通流測定、ヘルメット検出といった40種類以上の画像処理AIモデルを開発・習得しています。また、セキュリティや都市監視の分野において、3人乗り車両や大型貨物の積載車両の検知、火災や武器の検知といったベトナム特有のモデルも開発・習得しています。これらのモデルは、GPU、CPU、NPUなど、様々なハードウェア上で動作するように最適化されており、システムや顧客の多様な要件に対応しています。
VNPTのエンジニアは、特にオンプレミスモデルや数百台のカメラを同時に設置するエッジコンピューティングなど、大規模環境での効率的な導入を可能にするため、数百のビデオデータストリームの同時処理を可能にする最適な処理方法も構築しました。このアプローチにより、AIソリューションの拡張性が向上し、リソースを節約できるだけでなく、多くの地域のインフラ環境にも適応できます。
チームはその経験をAI City Challenge 2025に適用し、モデル圧縮によるサイズと処理リソースの削減、画像処理フローの最適化によるレイテンシの削減、プログラミング言語とコード構造の改良といった技術を組み合わせ、最高のパフォーマンスを実現する全体的な処理チェーンを構築しました。このアプローチにより、モデルの精度を維持しながら推論速度を向上させ、ハードウェアに制約のあるエッジデバイスへの展開も容易になります。
多分野にわたるディープラーニングAI研究プラットフォーム
VNPT が国際基準を満たし、権威あるコンテストで高い賞を獲得する包括的な AI 製品エコシステムを持つための重要な前提の 1 つは、若くて才能のあるスタッフのチームと強力なコンピューティング インフラストラクチャを所有しているだけでなく、多くの分野にわたる徹底的な AI 研究プラットフォームです。
画像処理におけるAIの応用に関しては、スマート都市・交通システムに加え、VNPTは医療分野への研究応用も推進しています。2025年9月、同グループは医療におけるAIとコンピュータービジョンに関する世界有数の会議であるMICCAI 2025で科学研究を発表しました。この研究は、甲状腺がんの診断におけるAIの応用に焦点を当てており、4年間にわたり国内3地域で約1万人の患者のデータを用いて実施されました。このプロジェクトは、国内の人口特性と病状に適した自動診断支援システムの開発に不可欠な役割を果たし、診断精度の向上、診断時間の短縮、医師の作業負荷の軽減、そして質の高い医療サービスへのアクセスを草の根レベルまで拡大することに貢献します。
VNPT の AI エンジニアリング チームは、多くの権威ある科学会議で研究を発表しました。
言語および音声処理の分野において、VNPTは自然言語処理に関するA*ランクのAIカンファレンスであるEMNLP 2025と、音声処理に関するA1ランクのカンファレンスであるICASSP 2025でも研究を発表しました。これらの研究では、大規模言語モデル(LLM)と生成AIの開発に高度な機械学習技術を適用し、ベトナム語の文脈、感情、ニュアンスといった複雑な要素をAIモデルが理解する能力を向上させることを目指しています。これらの要素は国際的なコーパスではほとんどモデル化されていません。これにより、ベトナム語は世界の自然言語処理研究コミュニティにおいてますます存在感を高め、ベトナム人に適した強力で独自の言語モデルを構築する可能性が開かれています。
出典: https://vnpt.com.vn/gioi-thieu/tin-tuc/nhom-ky-su-tre-viet-nam-hai-nam-lien-tiep-dung-dau-san-choi-ai-toan-cau.html






コメント (0)