![]() |
Google I/O 2026で講演するCEOのサンダー・ピチャイ氏。写真: Android Central 。 |
5月20日未明(ベトナム時間)に開催されたI/O 2026カンファレンスで、GoogleはGeminiの最新バージョンと、物理世界をシミュレートするAIモデルであるOmniを発表した。
CNETによると、このイベントは、Googleが膨大なユーザーベースにより多くのサービスを提供すると同時に、AIモデルの開発に追いつこうと急いでいる中で開催された。
I/O 2026は、OpenAIとAnthropicの急騰する企業価値に市場が注目している点でも注目に値する。両社とも今年中に新規株式公開(IPO)を実施すると予想されている。
Gemini 3.5フラッシュ:高速かつコスト効率に優れています
Googleは引き続きGeminiエコシステムに注力している。今回のイベントで同社は、Gemini 3.5 Flashを発表した。これは、同等のより高度なモデルの半額、あるいは3分の1の価格で、依然として高い性能を発揮する合理化されたバージョンである。
イベントに先立ち、CEOのサンダー・ピチャイ氏は記者団に対し、Gemini 3.5 Flashは「驚くほど高速だ」と語った。Googleは、これがGeminiおよびGoogle検索のAIモードにおけるグローバルなデフォルトモデルになると発表した。
「もはや速度のために品質を犠牲にする必要はありません」とGoogleは発表で強調した。同社によると、Gemini 3.5 Flashのサイバー攻撃対策が強化され、悪意のあるコンテンツの作成率が低下し、正常なコマンドが誤って拒否されるケースが減少したという。
![]() |
Gemini 3.5フラッシュは、高い効率性と高速な出力速度が特長です。画像: Google 。 |
Gemini 3.5 Flashは、複雑なエージェントベースのワークフロー向けに最適化されています。Googleによると、Terminal-Bench 2.1(76.2%対70.3%)やMCP Atlas(83.6%対78.2%)など、いくつかのベンチマークにおいてGemini 3.1 Proを上回る性能を発揮します。
1秒あたりのトークン出力数を考慮すると、Gemini 3.5 Flashは他の最新モデルと比べて4倍高速です。Googleによると、このモデルは従来数日から数週間かかっていたタスクの完了時間を短縮し、コストも削減できるため、プログラマー、企業、 科学者、そして一般ユーザーにとって理想的な製品となっています。
「分かりやすく言うと、大企業は1日に約1兆個のトークンを処理しています。もしそのワークロードの80%を3.5 Flashに移行すれば、年間10億ドル以上を節約でき、その相当な額の資金を事業に直接再投資できるでしょう」とピチャイ氏は強調した。
GoogleはGemini 3.5 Flashに続き、Gemini 3.5 Proが開発中で社内で使用されており、6月に一般公開される予定であることを明らかにした。
ジェミニ拡張
Geminiアプリもニューラル表現言語を用いて再設計されました。新機能として、常時稼働するパーソナルAIエージェント「Gemini Spark」が追加されました。この機能はGemini 3.5プラットフォーム上で動作し、Gmail、Googleドキュメント、Googleスライドと直接連携できます。
Gemini Sparkの特長は、バックグラウンドで動作できることであり、ユーザーがスマートフォンやコンピューターをロックした状態でも動作し続けることができる点です。
Sparkの用途としては、毎月のクレジットカード明細書を分析して購読料や隠れた料金を警告したり、メールをチェックして重要な情報を抽出・要約したり、会議の内容を要約してGoogleドキュメントに書き込んだりするなど、さまざまなものがあります。
![]() |
Geminiアプリにまもなく新機能が追加されます。写真: Google |
Androidでは、ユーザーはSparkなどのアクターからのリアルタイムのアップデートやタスクの進捗状況を、今年後半にリリース予定のAndroid Haloと呼ばれる新しいインターフェースを通じて追跡できるようになる。
今夏が終わるまでに、SparkはChrome内で直接動作するようになり、ブラウザはインターネット上でユーザーを支援するエージェントへと変化するだろう。
プライバシー保護のため、ユーザーはGemini Sparkの有効化を拒否し、接続するアプリを選択できます。この機能は、5月下旬から米国のGoogle AI Ultra加入者向けに順次展開される予定です。
デイリーブリーフもGeminiの新機能で、毎朝パーソナライズされた要約を提供します。メールやカレンダーから情報を収集し、簡潔なレポートを作成します。
![]() |
Geminiアプリのデイリーブリーフ要約機能。写真: Google 。 |
ユーザーは優先度の高い情報タイプをリクエストしたり、AIに次の処理手順を指示したりすることもできます。現在、Daily Briefは米国市場ではAI Plus、Pro、Ultraのサブスクリプションのみをサポートしています。
Googleはまた、macOS版Geminiアプリのいくつかのアップデートも発表した。その中には、ワークフローの処理と自動化のためのGemini Sparkとの統合も含まれている。
Ramblerの音声認識システムはmacOSにも対応しており、不要な単語を除去することで、音声をよりスムーズにテキストに変換することが可能です。
Gemini Omniで動画を作成
Gemini Omniは、物理世界をシミュレートするモデルです。DeepMindはこれまでにも同様のモデルをいくつか開発してきましたが、それらはロボット工学やゲーム用途に限られていました。
Omniを使用すると、ユーザーは画像、音声、テキストを組み合わせて、Geminiの実世界知識ベースに基づいた高品質のビデオを作成できます。
Googleによると、Omniは重力、運動エネルギー、流体力学といった物理法則を状況に応じて正確に適用できる。Geminiから得られた既存の知識のおかげで、このモデルはその後の出来事を予測することも可能だ。
![]() |
Gemini Omniが制作した動画。写真: Google 。 |
このモデルは自然言語による編集に対応しており、編集のたびに文脈が維持されます。コマンドを使用することで、ユーザーは簡単に文字を追加したり、オブジェクトを挿入したり、シーンを変更したりできます。
Omniは、リアルな外見と声を持つ仮想アバターの作成もサポートしています。すべての動画には、AIによって作成されたコンテンツを識別するためのSynthIDウォーターマークが付けられています。
Googleによると、最初のバージョンである「Gemini Omni Flash」は、Gemini、Flow、YouTube Shortsアプリに実装される予定だという。将来的には、このモデルは動画と音声の両方の出力に対応する予定だ。
![]() |
Googleは、Gemini Omniが物理世界を正確にシミュレートできる能力を強調している。写真: Google 。 |
Googleに関しては、投資コストの増加に伴い、ウォール街の期待は高まっている。CNETによると、投資家は同社が持続的な利益を生み出すために、AIをコア製品に深く統合することを望んでいる。エージェントツールは重要な役割を果たす可能性がある。
SparkやDaily Briefのようなインテリジェントエージェントは、Googleの解決策だ。同社は、コスト効率の高いGemini 3.5 FlashとOmniを組み合わせることで、競合他社に対する優位性を維持しようと努めている。
Googleだけではありません。AI企業への期待は高まり続けており、特にAnthropicがMythosを発表してからはその傾向が顕著です。このモデルは非常に強力で、世界のソフトウェアインフラに存在する数千もの前例のないセキュリティ脆弱性を検出できると謳われています。
出典:https://znews.vn/gemini-vuot-khoi-ranh-gioi-chatbot-post1652959.html













コメント (0)