
2017年に初開催されたZalo AIサミットは、AI分野の著名な専門家が一堂に会するイベントです。「AI化時代のベトナム」をテーマに開催されるZalo AIサミット2025では、日常生活におけるAI活用のソリューション、AIのトレンド予測、そしてAIをユーザーに身近なものにするためのZaloの取り組み事例を紹介します。
Zaloの技術ディレクターであるグエン・ミン・トゥ氏は、冒頭の挨拶で、AI時代は2018年から2019年にかけて最初のトランスフォーマーモデルが登場したことで幕を開けたと述べました。しかし、これらの言語モデルが高品質に達し、より多くの人々が利用できるようになるのは、2022年にGPT-3.5とChatGPTが登場してからでした。
「人々がChatGPTを使い始めた時、AI時代が始まったのです」とトゥ氏は強調した。
ベトナムにとって好ましい兆候
Google、Anthropic、DeepSeekといった企業が大規模言語モデリング(LLM)の技術をますます向上させるにつれ、AI市場はエージェント型AIと呼ばれる転換期を迎えつつある。
従来のAIは単一のタスクしか解決できないのに対し、エージェント型AIは複数のエージェントを接続して複雑な問題を処理できる自律システムである。
「エージェントAIは、まるで当社の従業員のように機能します。私たちの指示に基づいて、分析、推論、タスクの実行、レポートの作成を行うことができます」とトゥ氏は付け加えた。
ベトナムでは、Zaloは多くのAI機能を統合してユーザーにサービスを提供している企業の1つです。2025年までに、これらのサービスのユーザー数は1,700万人を超え、200%以上の増加が見込まれています。音声認識機能(音声をテキストに変換する機能)は750万人以上が利用しています。
「この機能によって、多くの人がZaloを使う方法を変えました。文字を入力する代わりに、音声を使う方がはるかに速くて便利です」とトゥー氏は強調した。
ベトナム語から英語へのメッセージ翻訳機能も多くのユーザーを魅了している。トゥ氏は、Zalo通話のリアルタイム翻訳機能が近日中に追加される予定だと明らかにした。
![]() |
Zalo テクノロジーディレクター、Nguyen Minh Tu 氏。 |
AIはエンドユーザーへのサービス提供だけでなく、Zaloの業務運営も支援している。同社は顧客サービス用のチャットボットを開発し、人員確保が難しいピーク時の規模拡大の課題解決に役立てている。
導入から3か月後、Zaloのチャットボットシステムは90%という高い応答率を達成し、人間の応答率を上回った。チャットボットによる人間の対応が必要となったケースは、全体のわずか2~3%程度だった。
Zaloの担当者は、プライバシーとセキュリティをめぐる課題が、AIを社内で活用する上で依然として存在することを認めた。そのため、同プラットフォームは柔軟なアプローチを採用し、機密性の高いデータには自社開発のモデルを適用し、機密性の低いデータには外部のチャットボットを活用している。
トゥー氏はまた、日常生活におけるAIアプリケーションソリューションの開発を競うコンテスト「Zalo AI Challenge 2025」についても言及した。今年のコンテストには、若者や学生に加え、多くの高校生が参加し、中には上位5位に入賞した生徒もいた。
「これは、AIが社会のあらゆる分野に浸透し、子どもたちが幼い頃からAIに触れる学校にまで広がっていることを示しています。これは『AI変革』の時代におけるベトナムにとって明るい兆しです」と、Zaloの担当者は強調した。
AIエージェントの波
最初のセッションでは、ホーチミン市工科大学のクアン・タイン・トー准教授が、マルチモーダルAIが世界をどのように変えるのかという問題を提起した。彼は、LLMは終焉期を迎えており、技術動向は徐々にマルチエージェントシステム(MAS)へと移行していると主張した。
准教授の博士は、GPT-3.5の導入によるLLMの重要なマイルストーンについて、Tu氏の意見に同意し、チャットボットの共通の目標は人間をできる限り忠実に模倣することであると述べた。AIエージェントの概念は以前から存在していたが、真に発展したのはLLMの枠組みの下においてのみである。
「エージェントは比較的古典的なアーキテクチャであり、LLMと組み合わせることで、モデル間の通信機能を提供します」とTho氏は述べた。「AIエージェント」と「エージェント型AI」というキーワードは、2024年後半から現在まで、Googleトレンドで最も検索された用語の1つでもある。
![]() |
クアン・タイン・トー准教授(博士)、ホーチミン市工科大学コンピュータ科学工学科長。 |
准教授は、エージェント型AIとは、複数のエージェントが連携して動作するシステムであると説明した。ユーザーからコマンドを受け取ると、エージェントはリクエストを分解し、タスクを割り当て、適切なツールを選択し、それらを段階的に実行することで、単一モデルよりも高い効率性を実現する。
トー氏はまた、国内企業におけるMASの具体的な応用例も紹介した。特に、AIエージェントはPDFファイル、画像、文書を同時に処理できるため、効率が40~60%向上する。保険業界では、この技術によって企業の業務量の20~40%を自動化できるという。
さらに、AIエージェントはリアルタイム情報を収集する能力を備えており、瞬時に市場価格を提供するのに役立ちます。[名前]准教授は、職場においてAIエージェントシステムはインテリジェントアシスタントとして機能し、保護者や生徒からの学校関連の質問に答えることができると述べています。 教育分野では、AIエージェントは各生徒の学習経路に合わせたパーソナライズされた学習モデルの作成を支援します。
![]() |
Zalo AI Summit 2025には、AI分野に関心を持つ多数の参加者が集まりました。 |
総じて、MASの利点は、複数の複雑な問題を並行して処理できる点にある。推論プロセスを通じて、エージェントは情報を独立して処理し、互いに学習し、ユーザーからも学習することで、エラーを減らし、正確でパーソナライズされた結果を生み出すことができる。
現代のエージェントアーキテクチャは、多くの場合、ユーザーフレンドリーなインターフェースを備えたツールやプラットフォームとして提供されており、一般の人々にとってより利用しやすくなっている。
こうした利点を踏まえ、トー氏は企業におけるテクノロジーの活用と社内業務プロセスの調整の重要性を強調した。同准教授によれば、世界的に活発なイノベーションの潮流が続く中で、企業はこの流れに特に注意を払う必要があるという。
エージェント型AIの次に来るものは何か?
近年、ヒューマノイドロボットはテクノロジー業界で注目を集めるトレンドとなっている。これは、物理AIの最も一般的な応用例でもある。
このテーマについて、Nvidiaベトナムのシニア開発技術者であるトラン・ミン・クアン博士は、生成型AIやエージェント型AIの時代に続き、物理AIがAIのトレンドにおける最も先進的な発展であると強調した。
「これらのAIモデルは、コマンドや入力データを受け取り、ロボットアーム、自律走行車、工場などのロボットのモーターや制御コンポーネントに影響を与える特定のアクションを生成することができます」とクアン氏は述べ、物理AIの概要を説明しました。
![]() |
Nvidiaのトラン・ミン・クアン博士が、物理AIの動向に関する見解を述べました。 |
Nvidiaの担当者によると、物理AIは将来的に1兆ドル規模の産業になる可能性があるという。現在の世界のハードウェアインフラには、約20億台の産業用カメラ、1000万の工場、20万の倉庫、15億台の車両が含まれており、さらに将来的に配備される可能性のある数十億台のヒューマノイドロボットも考慮に入れると、物理AIの応用可能性は計り知れない。
「もし各デバイスに現在の作業負荷を処理するためのAI『頭脳』が搭載されれば、今日とは全く異なる規模でタスクをサポートできるようになるだろう」とクアン氏は付け加えた。
物理AIの必要性は、多くの産業における人材不足に起因している。密閉された暗い空間での溶接作業など、過酷な環境下での高度な技能を要する仕事は、人間にとって困難であることが明らかになっている。
ロボットは、人員コストと運用コストのバランスを取るソリューションとして注目されています。ロボットは単に反復作業を行うだけでなく、新しいタスクを自律的に学習できるようになったため、コスト最適化が可能になりました。
「だからこそ、ロボット工学におけるChatGPTの『決定的な瞬間』は、今年か来年に訪れる可能性があるのです」とクアン氏は強調した。
![]() |
物理AIは、生成AIとエージェントAIに続く次の段階と考えられている。 |
このビジョンを実現するために、Nvidiaの担当者は、物理AI開発における3つの重要な段階に対応する3台のコンピュータからなるモデルを提案した。
したがって、第一段階ではサーバー上に基盤を構築することに重点を置きます。トレーニング後、モデルをシミュレーション環境に配置して因果関係を学習させることで、モデルが現実世界でより良い挙動を示すように支援します。
シミュレーションは、ロボットが物体を正確に認識し、それらをどのように扱うかを学ぶのに役立ちます。さらに重要なのは、シミュレーションによって複数のロボットが同時に連携し、実際のハードウェアを用意することなく衝突シナリオをテストできることです。そして最終的には、ハードウェアへの直接展開が可能になります。
大規模なAI導入における課題。
効率性の向上や意思決定の支援を目的として、テクノロジーを日常業務に統合する「AI化」のプロセスは、世界的に加速している。
Zalo AIの研究ディレクターであるチャウ・タイン・ドゥック博士によると、ベトナムにおけるAIの発展ペースは多くの要因に起因しており、中でも特にAIモデルの開発、ハードウェアとデータインフラの急速な改善、そしてデジタル変革プロセスが挙げられます。
ベトナムは、人材獲得プログラム、テクノロジーコミュニティの構築、政府の支援などからも明らかなように、AI開発において大きな潜在力を持つ国の一つとみなされている。さらに、ベトナム国民はデジタル変革への準備レベルが高いと評価されている。
![]() |
Zalo AIの研究ディレクター、チャウ・タン・ドゥック博士。 |
この変革の中で、Zaloは仮想アシスタント「Kiki」をはじめとする多くのAI関連機能をリリースしました。同社は、業務効率を高め、特に誰でも簡単に使えるツールの開発を目指しています。Zaloのツールは、コーディング、プログラミング、研究といった高度な作業から、コミュニケーション、翻訳、画像検索といった日常的な活動まで、あらゆる場面をサポートします。
しかし、専門家たちはこれはまだ始まりに過ぎず、AIへの変革プロセスには多くの困難が待ち受けていると考えている。Zalo AIの科学ディレクターであるグエン・チュオン・ソン博士は、その困難はセキュリティ、コストの問題、そしてユーザーからの高い要求に起因すると述べている。これらはZaloだけでなく、ユーザーや企業にとっても困難な点である。
最初の難関は、一定レベルの自律性を確保できるAIモデルを選択することである。サードパーティ製のモデルは、多くの場合、優れた性能と出力品質を提供する一方、自社開発モデルは情報制御の面で優位性を持つものの、安定性と効率性の面で限界がある。
![]() ![]() ![]() ![]() |
Zalo AIの担当者から提供された情報。 |
さらに、現在のほとんどのモデルは、精度が不十分であったり、出力が不安定であったりといった共通の弱点を抱えています。多くのチャットボットはベトナム語の理解と処理能力が限られており、特定の要件や状況に対応できていません。
この問題に対処するため、Zaloの専門家は、高度なモデル開発技術の適用や、チャットボットのトレーニング中に信頼性の高いデータソースを組み合わせるなど、いくつかの解決策を提案しました。同時に、開発チームは内部テストを通じてモデルの評価を継続的に行いました。
もう一つの課題は、コスト、パフォーマンス、セキュリティのバランスを取ることです。グエン・チュオン・ソン博士によると、複雑な要求を処理するために小型モデルを使用すると、処理時間と運用コストが増加する可能性があり、その逆もまた然りです。
![]() |
Zalo AI 科学ディレクター、Nguyen Truong Son 博士。 |
彼は、最適化はコマンド入力段階から開始できると主張した。ユーザーは、不要な長さを制限し、チャットボットに明確で簡潔なコンテキストを提供することで、トークンコストを削減できる。
システムレベルでは、Zaloチームは、適切なコマンドの提案や制御レイヤーの導入など、さまざまなソリューションを実装し、ユーザー情報の安全性とセキュリティを確保しています。
ベトナムは、世界的なAIの波に十分に対応できる体制が整っていると考えられている。Zaloは、この変革にいち早く参加した企業の1つであり、AIを大規模に導入する際のコスト、品質、セキュリティといった課題への取り組みに注力している。
熾烈なチップ競争
AIの爆発的な発展は、ハードウェア、すなわちチップの進歩の結果である。OpenAIのファム・ハイ・ヒエウ博士は、ChatGPTの登場がチップに革命をもたらし、Nvidiaが短期間で急速な成長を遂げることを可能にしたと強調している。
ChatGPTが最初にローンチされたとき、その動作はほぼ完全にNvidiaのチップに依存していた。そのため、AnthropicやMetaといったテクノロジー大手からのハードウェア購入が急増した。
しかし、このゲームはNvidiaだけのものではありません。AMDやGoogleといった競合他社も、AIモデリング開発者向けに最適なハードウェアソリューションを提供しています。
「半導体とその関連資本の流れは、経済の流れ、少なくとも米国経済の成長に影響を与える。」
さらに、AI開発を目指す企業は、チップの購入コストが上昇しているため、自社でチップを開発したいという野心も持っています。わずかなコスト削減でも大きなメリットとなるからです。だからこそ、どの企業もチップ資源の自給自足を目指しているのです」とヒュー氏は付け加えた。
![]() |
OpenAI代表のPham Hy Hieu博士。 |
AIチップ市場は現在、用途に基づいて大きく2つのカテゴリーに分けられます。1つ目はトレーニングチップで、大規模な行列乗算、均一な次元性、そして数千個のチップを同時に接続するための高い帯域幅が求められます。
2つ目のタイプは推論チップで、必要なリンク数は比較的少なく(50~100個程度)、小規模で不規則なサイズの行列問題に特化しています。ただし、推論チップは持続的な動作のために優れた電力最適化が求められます。
開発の歴史を振り返ると、2019年から2023年まではGPTモデルの学習とデータ圧縮に重点が置かれていたが、2024年以降は推論機能へと重点が移りつつある。この変化は、推論チップへの需要の高まりにつながる。
「チップ製造業界において、ベトナムはどのような役割を担うのでしょうか?チップ産業は数兆ドル規模の産業ですが、参加するために何百億ドルもの資金は必要ありません。ベトナム人は様々な形でAIチップ分野に貢献できるのです」とヒエウ氏は語った。
![]() |
ファム・ヒー・ヒエウ博士による、AIインフラストラクチャにおけるハードウェアに関する見解。 |
OpenAIの代表者は、主に2つの方向性を提案した。大規模言語モデル向けのチップ開発競争に注力するのではなく、ベトナムは自動車、スマートフォン、埋め込み型医療機器向けの低消費電力チップの開発に注力すべきだという。これらは、大きな成長可能性を秘め、投資コストも低い市場分野である。
第二に、ハードウェアとソフトウェアの統合があります。Flash Attention 2アルゴリズムのような成果は、プログラミングとハードウェアを巧みに組み合わせることで、莫大な資本投資を必要とせずに画期的な成果を生み出すことができることを示しています。
「未来は、チャンスを見出す勇気、リスクを冒す勇気、そして危険に立ち向かう勇気を持つ人々の手に委ねられている」とヒュー氏は締めくくった。
Zalo AI Challenge 2025で活躍した優秀チーム
講演者のプレゼンテーションに続き、Zalo AI Challenge 2025では、AIを応用するための多くの実践的なソリューションが発表されました。10月下旬に開始されたこのコンテストには、1,000以上のチームが参加しました。
今年のZalo AIチャレンジは、RoadBuddy(アルゴリズムを用いて交通標識を識別する)とAeroEyes(ドローンが地上の物体を認識するためのAIを設計する)の2つのカテゴリーに分かれています。優勝チームには、賞金総額12,000ドルとスポンサーからの賞品が贈られます。
主催者によると、今年の試験問題はすべて実践的な内容で、研究環境以外でもAIが現実世界の問題を解決する可能性を示すものだったという。
RoadBuddyチャレンジでは、参加者は車載ダッシュカムのデータ処理に重点を置いた。各チームは、さまざまな時間帯に撮影された0~15秒間の動画データセットを処理する必要があった。AIモデルの役割は、動画に映っている道路標識、信号機、車線表示などの詳細を正確に識別することだった。
![]() ![]() ![]() ![]() |
Zalo AI Challenge 2025の賞品の発表と授与。 |
1,500個のトレーニングサンプル、500個の公開テストサンプル、および500個の非公開テストサンプルからなるデータセットを用いて、競合チームは精度と応答時間の2つの基準に基づいて評価された。
グエン・チュオン・ソン氏の評価によると、出場者たちはビジョン言語モデル(VLM)などの高度な技術を駆使していた。一般的なプロセスとしては、ビデオからフレームを抽出して入力データとし、それをQwenやYOLOといったモデルと組み合わせて物体を識別し、論理的な分析を行うというものだ。
最終結果では、CtelAIチームが正答率71.3%で1位となり、BitterSweetチームが70.5%で2位となった。
「AeroEyes」をテーマに、各チームは予選ラウンドを経て決勝に進出した。決勝では、参加者はドローンに直接モデルをプログラミングし、飛行経路を設定し、実際の環境下でカメラを制御して物体を検出する必要があった。
課題の難易度が高かったため、要件を満たすチームの数は多くありませんでした。そこで主催者は柔軟に補足テーマを導入しました。参加チームは要件を満たすために迅速にモデルを調整しました。その結果、最高の効率性を発揮したAIO_C3Aチームが優勝しました。2位はIUH_Alers_K16チームとAEBチームが同率でした。
出典:https://znews.vn/ai-se-di-xa-den-dau-post1613033.html
























