この新世代の幕開けとなるのが、同社がこれまでで最も賢いと主張する思考能力を備えたマルチモーダル AI モデル、Gemini 2.5 Pro Experimental です。このモデルは、本日3月26日よりGoogle AI Studio開発者プラットフォームおよびGemini Advanced加入者向けのGeminiアプリ(月額20ドル)で利用可能となる。

ジェミニ 2.5 には、答えを出す前に「考えるために一時停止する」機能があります。 (写真:Google)
考えるAI - Googleの新たな方向性
Googleは今後、すべての新しいAIモデルに思考機能が組み込まれると発表した。
OpenAIが2024年9月に初の思考型AIモデルであるo1を発表して以来、テクノロジー業界はその能力に匹敵、あるいは凌駕しようと競い合っている。現在、Anthropic、DeepSeek、Google、xAI にはいずれも、追加の計算能力を使用して情報を調べ、問題を分析してから答えを提供する思考 AI モデルがあります。
認知 AI の進歩により、モデルは数学とプログラミングに優れた成果を上げることができます。多くの技術専門家は、これが AI エージェント(人間の介入なしにタスクを実行できる自動化システム)にとって重要な基盤になると考えています。しかし、思考する AI はより多くのリソースを消費するため、運用コストが高くなります。
グーグルは以前、2024年12月にジェミニの特別バージョンでAI思考をテストした。しかしジェミニ2.5は、同社がOpenAIの「o」シリーズに対抗すべくこれまでで最も真剣に取り組んだものだ。
複数の基準で優れたパフォーマンス

Gemini 2.5 Pro は、数多くのテストで多くのトップ競合製品に勝ちました。 (写真:Google)
Google は、Gemini 2.5 Pro は以前の AI モデルよりも優れているだけでなく、数多くのテストで多くのトップ競合製品に勝っていると主張しています。
プログラミングコードの編集能力を測定するAider Polyglotベンチマークでは、Gemini 2.5 Proは68.6%のスコアを獲得し、OpenAI、Anthropic、DeepSeekのトップモデルを上回りました。
しかし、ソフトウェア開発能力の SWE-bench Verified テストでは、Gemini 2.5 Pro は 63.8% のスコアを獲得しました。これは OpenAI o3-mini や DeepSeek R1 よりも高いスコアですが、Anthropic の Claude 3.7 Sonnet (70.3%) よりは低いスコアです。
数学、社会科学、自然科学にわたる何千もの質問を含む多分野にわたるテストである「人類の最後の試験」において、Gemini 2.5 Pro は 18.8% のスコアを獲得し、他のほとんどの主要な AI モデルよりも高いスコアを獲得しました。
特筆すべきは、Gemini 2.5 Pro は一度に 100 万トークンを処理できることです。これは約 75 万語に相当し、ロード オブ ザ リングの小説シリーズ全体よりも長いです。 Google はまた、近い将来このモデルが最大 200 万のトークンをサポートし、長いコンテキストを分析して記憶する能力が大幅に向上することを明らかにしました。
Google は Gemini 2.5 Pro の API 価格をまだ明らかにしていません。同社は今後数週間以内にさらに詳しい情報を提供する予定だと述べた。
出典: https://vtcnews.vn/google-ra-mat-gemini-2-5-the-he-mo-hinh-ai-tu-duy-moi-ar933854.html
コメント (0)