Googleは、同社のAlphaGeometry 2が国際数学オリンピックで金メダルを獲得した生徒のレベルに達したことを示すAIの結果を発表した。
国際数学オリンピックは、才能ある学生のための毎年恒例のコンテストです - 写真: Nature.com
2024年1月以来、Google DeepMindチームは、権威ある科学誌Natureにおいて、アルファ幾何学問題を解くAIツールを発表し、世界を驚かせています。DeepMindは、国際数学オリンピック(IMO)で銀メダルを獲得した学生たちのレベルを実証しました。
ベトナムの科学者が参加
2025年2月5日、Google DeepMindのAIチームは、新システム「AlphaGeometry 2」の成果を発表しました。このシステムはIMO金メダリストの平均スコアを上回りました。この結果はプレリリース表に記載され、Nature誌にも掲載されました。
特別なこととして、この Google DeepMind グループの研究メンバーには、2024 年の論文には 3 人のベトナム人科学者 (THTrinh、Y.Wu、QVLe、H.He、T.Luong)、今年 (2025 年) の論文には 4 人のベトナム人科学者 (Yuri Chervonyi、Trieu H.Trinh、Miroslav Olšák、Xiaomeng Yang、Hoang Nguyen、Marcelo Menegali、Junehyuk Jung、Vikas Verma、Quoc V.Le、Thang Luong) が含まれています。
「コンピューターがIMOで満点を取る日もそう遠くないと思う」とインペリアル・カレッジ・ロンドンの数学者ケビン・バザード氏は言う。
ユークリッド幾何学の問題は、IMO数学試験の4つの科目のうちの1つです。他の科目には、数論、代数、組合せ論が含まれます。幾何学の問題は、平面上の幾何学的対象に関する厳密な証明を導き出さなければならないため、特別なスキルが求められます。
昨年 7 月、AlphaGeometry 2 は、国際オリンピックの幾何学問題に含まれない問題を解くために DeepMind が開発した新しいシステム AlphaProof とともに一般に公開されました。
IMO でコンピューターが完全なスコアを獲得するまでには、そう長くはかからないと思います。
ケビン・バザード(英国インペリアル・カレッジ・ロンドンの数学者)
数学の言語
Google AI チームは、DeepMind の「言語モデル」を一般的な数学言語を話すようにトレーニングし、出力の論理的正確性を自動的にチェックし、AI チャットボットが頻繁に行う誤った発言や矛盾した発言を除去できるようにしました。
AlphaGeometry 2では、Googleの最先端大規模言語モデルであるGeminiの統合など、数々の改良が行われました。また、平面上の幾何学的オブジェクトを移動させることでAIが推論を行う機能(例えば、直線に沿って点を移動させることで三角形の高さを変える機能)や、線形方程式を解く機能も導入されました。
AlphaGeometry 2 システムは、過去 25 年間の IMO 数学コンテストで出題されたすべての幾何学の問題の 84% を解くことができ、これはオリンピックの金メダル レベルです。一方、AlphaGeometry は 54% を達成しました。
昨年、インドと中国の AI チームは他の方法を使用して幾何学でも金メダルレベルの結果を達成しましたが、対象は IMO の幾何学の問題のより小規模なセットでした。
DeepMind の論文の著者は、AlphaGeometry の将来的な改良には不等式や非線形方程式を含む数学の問題の解決が含まれ、あらゆる幾何学の問題を解くことができるようになるだろうと書いている。
急速な進歩
「AI数学オリンピック賞」と呼ばれるこの500万ドルの賞金は、数学オリンピック全体で金メダルレベルのパフォーマンスを達成した最初のAIシステムに贈られる。そのシステムはオープンソースであることが条件だが、DeepMindはまだオープンソース化していない。
ケビン・バザード氏は、Google DeepMindとインド・中国の両チームの急速な進歩には驚きはなかったと述べた。しかし、問題は難解ではあるものの、概念的には単純であり、AIが数学研究レベルの問題に取り組むには克服すべき課題が数多くあると付け加えた。
来たる国際数学オリンピックを心待ちにしています
AI研究者たちは、7月にオーストラリアのサンシャインコーストで開催される国際数学オリンピック(IMO)を心待ちにしています。大会の問題が参加者に公開されれば、AIシステムも解けるようになるかもしれません。(AIチームは大会への参加が認められていないため、メダル獲得の資格はありません。)
このような新しい問題は、完全に新しいか、その解決策がまだ現れていないためトレーニング データで回避され、AI ソリューションの結果の整合性が失われるため、AI システムにとって最も信頼性の高いテストであると見なされます。
[広告2]
出典: https://tuoitre.vn/ai-da-dat-trinh-do-huy-chuong-vang-olympic-toan-quoc-te-20250216075505787.htm
コメント (0)