Az OpenAI és a Google közösen nyerte az „aranyérmet” a 2025-ös IMO matematikai olimpián: Aranyat kevernek a rézzel?

Az eredmények aláhúzzák a mesterséges intelligencia rendszerek gyors fejlődési ütemét, és azt mutatják, hogy a Google és az OpenAI most egyenlő arányban állnak a mesterséges intelligencia versenyében.

A mesterséges intelligenciával foglalkozó vállalatok ádáz versenyt folytatnak azért, hogy azt a látszatot keltsék, ők járnak az élen – ez egy „érzelmi háború”, amely nagy hatással lehet a legjobb MI-tehetségek vonzására. Sok MI-kutató versenyképes matematikai háttérrel rendelkezik, így az olyan mérföldkövek, mint az IMO, különösen jelentősek.

2024-ben a Google ezüstérmet nyert az IMO-n egy „formális” mesterséges intelligenciarendszerrel, amely megkövetelte, hogy az emberek lefordítsák a problémát számítógépes nyelvre. Idén mind az OpenAI, mind a Google belépett az „informális” mesterséges intelligenciarendszerek piacára, amelyek képesek egy problémát elolvasni és bizonyításszerű megoldást generálni természetes nyelven.

Mindkét vállalat azt állítja, hogy mesterséges intelligencia modelljeik hat kérdésből ötre helyesen válaszoltak, magasabb pontszámot elérve, mint a legtöbb középiskolás diák, és jobban teljesítettek, mint a Google rendszere tavaly anélkül, hogy a kérdéseket gépi nyelvre fordították volna.

A Google DeepMind képviselője az IMO 2025-ön. (Fotó: Google)

A TechCrunch-nak adott interjúkban az OpenAI és a Google IMO kutatói azt mondták, hogy ezek az aranyérmes teljesítmények áttörést jelentenek a nehezen ellenőrizhető területeken alkalmazható MI-érvelési modellek építésében. Míg az érvelési modellek általában jól teljesítenek a világos válaszokat adó kérdésekben, mint például az egyszerű matematika vagy a programozás, nehezen boldogulnak a nagyon kétértelmű feladatokkal, mint például a jó szék kiválasztása vagy az összetett kutatások támogatása.

A Google azonban megkérdőjelezi az OpenAI hozzáállását az IMO-s eredmény bejelentéséhez. Röviddel azután, hogy az OpenAI július 19-én reggel bejelentette az elért eredményét, a Google DeepMind vezérigazgatója és kutatói a közösségi médiában kritizálták az OpenAI-t, amiért ilyen korán – ilyen hamar azután, hogy az IMO előző este bejelentette a diákok eredményeit – bejelentették az aranyérem elérését, és mert az OpenAI modelljét az IMO még nem értékelte hivatalosan.

Thang Luong, a Google DeepMind vezető kutatója és az IMO projekt vezetője a TechCrunchnak elmondta, hogy a Google a versenyzők iránti tiszteletből július 21-ig várt az eredmények bejelentésével.

Luong elmondta, hogy a Google már tavaly óta együttműködik az IMO szervezőbizottságával a vizsga előkészítésén, és a vizsga bejelentése előtt megerősítést és hivatalos pontozási eredményeket szeretett volna kapni az IMO elnökétől. „Az IMO szervezőbizottságának saját pontozási irányelvei vannak” – mondta Luong. „Tehát minden olyan értékelés, amely nem ezeken az irányelveken alapul, nem nyilvánítható aranyérem szintűnek.”

Eközben Noam Brown, az OpenAI vezető kutatója, aki az IMO modellen dolgozott, elmondta, hogy az IMO szervezői néhány hónappal ezelőtt felvették a kapcsolatot az OpenAI-val, hogy meghívják őket a hivatalos vizsgán való részvételre, de a vállalat elutasította a kérést, mivel a természetes nyelvi feldolgozó rendszer fejlesztésére összpontosított. Brown szerint az OpenAI nem tudott arról, hogy az IMO egy informális vizsgát rendez a Google-lel.

Az OpenAI közölte, hogy független zsűritagot – három korábbi IMO-érmesből – bízott meg mesterséges intelligencia modelljének értékelésével. Miután megtudták az aranyérem eredményét, az OpenAI felvette a kapcsolatot az IMO-val, és azt a tanácsot kapták, hogy várják meg a július 18-i esti díjátadó ünnepség utáni időpontot a bejelentéssel.

Az IMO nem reagált a TechCrunch megkeresésére a megkereséssel kapcsolatban.

A TechCrunch szerint a Google nem téved teljesen: a vállalat egy formálisabb és szigorúbb folyamatot követett az aranyérem eléréséhez, de a vita elhomályosíthatja a nagyobb képet: a vezető laboratóriumok számos mesterséges intelligencia modelljei gyors ütemben fejlődnek. A világ országai küldték legjobb diákjaikat az IMO-ra idén, de csak kis százalékuk érte el az OpenAI és a Google modelljeinek szintjét.

Bár úgy tűnt, hogy az OpenAI jóval megelőzi iparági riválisait, a verseny most sokkal szorosabb. Az OpenAI várhatóan a következő hónapokban kiadja a GPT-5-öt, és a vállalat minden bizonnyal el akarja őrizni a mesterséges intelligencia piacvezetőjeként szerzett imázsát.

A 66. Nemzetközi Matematikai Olimpiát július 10. és 20. között rendezték meg az ausztráliai Queensland állambeli Sunshine Coaston, több mint 639 versenyző részvételével, 113 delegációból, országokat és területeket képviselve. Az idei versenyen összesen 72 sorérem, 104 ezüstérem és 145 bronzérem gyűlt össze.
Az IMO 2025 vizsga 6 feladatból áll: 2 aritmetikai feladatból, 2 kombinatorikus feladatból, 1 geometriai feladatból és 1 algebrai feladatból (kombinatorikus állításokkal és kombinatorikus gondolkodási követelményekkel).

(Forrás: Vietnamnet)

Link: https://vietnamnet.vn/openai-va-google-cung-dat-huy-chuong-vang-toan-imo-2025-vang-thau-lan-lon-2424424.html

Forrás: https://vtcnews.vn/openai-va-google-cung-dat-huy-chuong-vang-toan-imo-2025-vang-thau-lan-lon-ar955683.html