![]() |
Google Geminiのロゴ。写真:ブルームバーグ。 |
Googleは11月下旬にGemini 3モデルをリリースしました。同社は、コーディング機能の向上、ビジュアルイメージ作成、ユーザーに代わって特定のタスクを実行するエージェントなど、一連の注目すべきアップグレードを導入しました。
GoogleはGemini 3を発表した際、これが同社の「これまでで最もスマートなモデル」であることを強調しました。実使用においては、このモデルは処理速度が速く、推論能力も向上していますが、まだ改善の余地は残っています。
インタラクティブなインターフェースを素早く作成します。
Gemini 3の主要なアップグレードの一つは、Canvasを中心としたものです。CanvasはGemini内のインタラクティブなワークスペースで、チャットボットにコードの記述、結果の視覚化、コンテンツの編集を依頼できます。
ジェミニ 3 にサッカー ボール、地球、太陽、天の川の大きさの違いの 3D モデルを作成するように指示すると、ツールはコーディング インターフェイスを起動し、対話型環境を処理および作成して、ユーザーがオブジェクトのサイズを選択して比較できるようにします。
![]() |
Gemini 3 の Canvas 機能を使用してインタラクティブな空間を作成する機能。 |
Googleのデモと比較すると、画質は若干劣りますが、オブジェクトに関する情報は明確で分かりやすいです。処理時間は約2分です。Canvasインターフェースでは、ユーザーはコードを直接編集したり、コンテンツをコピーしたり共有したりできます。
別のコマンドで、Gemini 3に木の枝に止まったワシの3D立方体(ボクセル)モデルを作成するように指示しました。ツールは約45秒で結果を生成し、ユーザーはマウスを使ってビューを拡大したり回転したりできました。ただし、画像の一部にグラフィックエラーがあり、安定して表示されませんでした。
木の枝に止まっているワシも存在しましたが、要件がより困難でした(3Dモデル)。当初、Gemini 3で生成されたコードは失敗し、実行できませんでした。修正を依頼した後、画像が表示され、インタラクティブになりました。
![]() |
インタラクティブな環境を作成する Gemini 3 の機能。 |
いくつかの問題は残っていますが、質問と回答のモデルから共同編集のアプローチへの移行は興味深い方向性であり、Gemini 3 は複雑で長期的なタスクに役立ちます。
もちろん、Gemini 3はグラフィックやビジュアルモデルの作成だけを目的としたものではありません。GoogleはAI Proユーザー向けに「Generative UI」機能をテストしています。特定のコマンドを使用することで、モデルはインタラクティブな雑誌スタイルのインターフェースやビジュアルウェブサイトを作成できます。
Googleによると、この機能は段階的に展開されるとのこと。The Vergeの体験談によると、ユーザーはビジュアルレイアウト機能を選択し、「ローマへの3日間の旅行を計画して」などのコマンドを入力する必要があるようです。
Gemini 3は処理後、旅行ウェブサイトに似た結果を生成します。これには旅程、詳細な画像、旅行の好みや食習慣に関するいくつかの質問が含まれます。モデルはそれに応じて回答を調整します。この機能は、コンピューターの組み立て方や水槽の作り方といったトピックにも非常に役立ちます。
より効果的な推論と分析。
Googleによると、Gemini 3は前モデルよりも優れた推論能力を備えているとのことです。同社によると、Gemini 3 Proの推論能力は博士号レベルに達しており、人類最後の試験で37.5%、GPQAダイヤモンド試験で91.9%のスコアを獲得しました。
もちろん、ユーザーがその違いを真に理解できるのは、モデルと直接やり取りしたときだけです。GPQA Diamondの参考問題集(博士課程レベル向け)の問題を解くように指示されたとき、Gemini 3 Proは約30秒で、ステップバイステップの説明と説明画像を含む詳細な解答を提供しました。
![]() |
ジェミニ 3 は複雑な質問に答えることができ、博士レベルに相当する思考能力を発揮します。 |
評価によると、この解答は非常に詳細で、正しい手順に沿っています。比較のために、GPT-5.1も正解に約30秒かかりましたが、解答はそれほど詳細ではありませんでした。同様に、Claude 4.5 Sonnetも正解し、Gemini 3よりも早く解答しましたが、解答はそれほど詳細ではありませんでした。
Googleによると、Gemini 3はテキスト、画像、 動画など複数のソースから同時に文書を抽出できるという。これまでトレーニングされたことのないタスクも、Gemini 3ではより適切に処理される。
![]() |
Gemini 3 のビデオ分析機能。 |
例えば、57分間の動画の主要トピックを分析するように指示された際、Gemini 3は、要求された引数と動画の該当セグメントのタイムスタンプを含む結果をわずか1分ほどで提供しました。同様に、モデルはテニスの動画を正しく識別し、試合内容と各選手のプレースタイルを分析しました。
ユーザーはGemini 3に、動画の視聴と外部ソースの参照を同時に指示したり、より深い分析のための質問をしたりすることができます。全体的に見て、Gemini 3はGoogle検索データベースとの接続もあって、分析や文書参照のタスクにおいて非常に応答性が高くなっています。
エージェントは役に立ちますが、まだ問題が残っています。
エージェント機能も、Gemini 3 の注目すべきアップグレードです。AI Ultra プラン (現在は米国市場でのみ利用可能) のユーザーの場合、このモードでは、電子メールの分類と整理、情報の検索、旅行チケットの予約など、ユーザーに代わって複雑なタスクを実行できます。
Gemini 3のリリース時、GoogleはGmailの受信トレイを整理する機能を例に挙げました。The Vergeの体験談によると、この機能はまさに要望通りに動作し、1週間分の未読メールの完全なリストを作成します。
Canvas機能と同様に、メールリストと推奨アクションは別の領域に表示されます。Geminiには、重要なメールのリマインダー設定、プロモーションメールのアーカイブなど、いくつかのオプションが用意されています。
![]() |
Gemini 3のエージェント機能はGmailの受信トレイ管理に役立ちます。画像: The Verge |
請求書の支払いリマインダーを作成するよう指示されると、Gemini は関連情報を Google Tasks に素早く入力します。支払いタスクでは、エージェントが自動的に操作を進め、ユーザーに支払い情報を入力させる必要があるところで停止します。
全体的に見て、Gemini 3のエージェントは、ユーザーが忘れがちなメールを検出するのに非常に役立ちます。また、このツールは、もはや役に立たない広告アドレスからのメールを見つけて購読を解除することもできます。
実際、PerplexityやChatGPTといったチャットボットのエージェントは既にGmailとの連携をサポートしています。しかし、Geminiは最も多様な連携機能を提供しています。例えば、Perplexityでは保存または削除したいメールを具体的に入力する必要がありますが、Geminiではこれらの操作をボタン一つで実行できます。
![]() |
Gemini 3 のインタラクティブ インターフェース作成機能。写真: The Verge 。 |
ChatGPTのメール振り分け機能も不安定です。しかし、Geminiのメール送信速度はPerplexityよりも遅く、レストランの予約など、一部のタスクでは時々問題が発生することがあります。
支払いやメールの送信といった機密性の高い操作を行う前には必ずユーザーの確認が必要ですが、特定のタスクをAIに委任することには依然としてユーザーの躊躇が残ります。Gemini 3のエージェントモードは非常に便利ですが、ユーザーは依然として出力を監視する必要があります。
出典: https://znews.vn/gemini-3-tot-den-dau-post1607493.html













コメント (0)