![]() |
Google Geminiのロゴ。写真:ブルームバーグ。 |
Googleは11月末にGemini 3モデルをリリースしました。同社は、コーディング機能の向上、視覚化、ユーザーに代わって特定のタスクを実行するエージェントなど、一連の注目すべきアップグレードを導入しました。
GoogleはGemini 3を発表した際、これが同社の「これまでで最もスマートなモデル」であると強調しました。実際の使用経験から、このモデルは処理速度が速く、推論能力も向上しているものの、改善が必要な要素もいくつかあることが示されています。
インタラクティブなインターフェースを素早く作成
Gemini 3 の大きなアップグレードの 1 つは、Canvas です。Canvas は、チャットボットにコードの記述、結果の視覚化、コンテンツの編集を依頼できる、Gemini のインタラクティブなワークスペースです。
ジェミニ 3 にサッカー ボール、地球、太陽、天の川の大きさの違いを示す 3D モデルを作成するように指示すると、ツールは対話型のコーディング、処理、および作成インターフェイスを起動し、オブジェクトを選択してサイズを比較できるようになります。
![]() |
Gemini 3 の Canvas 機能を使用してインタラクティブな空間を作成する機能。 |
Googleのデモと比較すると、画質は若干劣りますが、その代わりにオブジェクトに関する情報は明確かつ分かりやすく提供されています。処理時間は約2分です。Canvasインターフェースでは、ユーザーはコードを直接編集したり、コンテンツをコピーまたは共有したりできます。
別のコマンドで、ジェミニ3号機は木の枝に止まっているボクセルスタイルのワシを作成するように指示されました。ツールは約45秒後に結果を表示し、ユーザーはマウスを使って画像を拡大したり回転したりできました。しかし、画像の一部にグラフィックエラーがあり、正しく表示されませんでした。
木の枝に止まったワシの絵も描かれていますが、こちらはより難しいリクエスト(3Dモデル)です。Gemini 3で生成されたコードは最初はクラッシュして実行できませんでした。修正をリクエストした後、画像が表示され、インタラクティブになりました。
![]() |
Gemini 3 のインタラクティブな環境作成機能。 |
いくつかの問題はあるものの、質問と回答のモデルから共同編集への移行は興味深い方向性であり、Gemini 3 は複雑で長期的なタスクに役立つものとなるでしょう。
もちろん、Gemini 3はグラフィックやビジュアルモデルの作成だけを目的としたものではありません。GoogleはAI Proユーザー向けに「Generative UI」機能をテストしています。このモデルは、いくつかのコマンドを実行するだけで、インタラクティブな雑誌風のインターフェースやビジュアルウェブサイトを作成できます。
Googleによると、この機能は段階的に展開されるとのこと。The Vergeが体験したように、ユーザーはビジュアルレイアウト機能を選択し、「ローマへの3日間の旅行を計画して」のようなコマンドを入力する必要があります。
Gemini 3は処理後、旅行ウェブサイトのような詳細なスケジュールと画像に加え、旅行の好みや食生活に関するいくつかの質問を含む結果を生成します。そこからモデルは回答を適宜調整します。この機能は、コンピューターの組み立て方や水槽の作り方といったトピックにも非常に役立ちます。
より効果的に推論し分析する
Googleによると、Gemini 3は前モデルよりも優れた推論能力を備えているとのことです。同社によると、Gemini 3 Proの推論能力は博士号レベルに達しており、人類最後の試験で37.5%、GPQAダイヤモンド試験で91.9%のスコアを獲得しています。
もちろん、ユーザーが違いを実感できるのは、モデルに直接触れたときだけです。GPQA Diamondリファレンスセット(博士課程レベル向け)から抜粋した問題を解くように指示されたとき、Gemini 3 Proは約30秒で、問題の各ステップと説明画像を含む詳細な解答を提供しました。
![]() |
Gemini 3 は複雑な質問に答えることができ、思考能力は博士レベルに相当します。 |
評価によると、この解法は非常に詳細で、手順に沿っています。比較のために、GPT-5.1も約30秒で正解しましたが、解答はそれほど詳細ではありませんでした。同様に、Claude 4.5 Sonnetも正解し、Gemini 3よりも速かったものの、解答はそれほど詳細ではありませんでした。
Googleによると、Gemini 3はテキスト、画像、 動画など、複数のソースから一度に文書を抽出できるという。これまで学習されていなかったタスクも、Gemini 3ではより適切に処理される。
![]() |
Gemini 3 のビデオ分析機能。 |
例えば、57分間の動画の主要トピックを分析するように指示された際、Gemini 3は要求された引数と動画の該当箇所のタイムスタンプを含む結果をわずか1分ほどで返しました。同様に、モデルはテニスに関する動画を正しく識別し、試合内容と各選手のプレーを分析しました。
ユーザーは、Gemini 3に外部ソースを参照しながら動画を視聴するよう指示したり、より深い分析のために質問をしたりすることができます。全体的に見て、Gemini 3はGoogle検索データベースへの接続もあって、ドキュメントの分析と参照において非常に応答性が高くなっています。
エージェントは役に立つが問題がある
エージェントもGemini 3の注目すべきアップグレードです。AI Ultraパッケージ(現在は米国市場のみをサポート)のユーザーの場合、このモードでは、電子メールの並べ替えや整理、情報の検索、旅行チケットの予約など、ユーザーに代わって複雑なプロセスを実行できます。
Google が Gemini 3 をリリースしたとき、Gmail の受信トレイを整理する機能が披露されましたが、 The Vergeの体験では、その機能はまさに期待通りに動作し、1 週間の未読メールの完全なリストが生成されました。
Canvas機能と同様に、メールリストと推奨アクションは別の領域に表示されます。Geminiには、重要なメールのリマインダー設定、プロモーションメールのアーカイブなどのオプションが用意されています。
![]() |
Gemini 3のエージェント機能はGmailの受信トレイ管理をサポートします。写真: The Verge |
請求書の支払いリマインダーの作成を依頼されると、Gemini は関連情報を Google Tasks に素早く取り込みます。支払いタスクでは、エージェントが自動的に操作を進め、ユーザーに支払い情報を入力させる必要があるところで停止します。
全体的に見て、Gemini 3エージェントは、ユーザーが忘れてしまいそうなメールを検出するのに非常に役立ちます。また、不要になった広告アドレスからのメールを見つけて購読解除することもできます。
実際、PerplexityやChatGPTといったチャットボットエージェントは既にGmailとの連携をサポートしています。しかし、Geminiの連携機能は最も多様です。例えば、Perplexityでは保存または削除したいメールを具体的に入力する必要がありますが、Geminiではボタン操作で操作できます。
![]() |
Gemini 3のインタラクティブインターフェース作成機能。写真: The Verge |
ChatGPTのメールスケジュール機能も不安定です。しかし、Geminiのメール配信速度はPerplexityよりも遅いです。レストランの予約など、一部のタスクでは時々問題が発生します。
支払いやメールの送信といった機密性の高い操作を行う前には必ずユーザーの確認が必要ですが、一部のタスクをAIに任せることには依然としてユーザーの躊躇を招きます。Gemini 3のエージェントモードは非常に便利ですが、ユーザーは依然として出力を監視する必要があります。
出典: https://znews.vn/gemini-3-tot-den-dau-post1607493.html

















コメント (0)