Május közepén egy titkos találkozóra került sor a matematika világában. A világ 30 vezető matematikusa titokban Berkeley-be, Kaliforniába utazott, hogy részt vegyen egy "gondolkodni" képes chatbottal való összecsapáson. A chatbot feladata az volt, hogy megoldjon maguk a matematikusok által írt problémákat, és tesztelje problémamegoldó képességét.
Miután két napig folyamatosan professzori szintű kérdéseket szórtak rá, a matematikusok meglepődve tapasztalták, hogy ez a chatbot képes megoldani a történelem legnehezebb problémáit.
„Láttam, hogy a kollégák nyíltan kijelentették, hogy ez a nagy nyelvi modell a matematikai zsenialitás szintjét közelíti” – mondta Ken Ono, a Virginiai Egyetem professzora, az ülés elnöke és zsűritagja a Scientific Americannak.
A figyelmünket felkeltő chatbot az o4-mini-n alapul, amely egy összetett gondolkodásra tervezett nagyméretű nyelvi modell (LLM). Az OpenAI terméke, és kifinomult gondolkodás végrehajtására van betanítva. A Google-től származó, ezzel egyenértékű modell, a Gemini 2.5 Flash hasonló képességekkel rendelkezik.
A korábbi ChatGPT LLM modellekhez hasonlóan az o4-mini is megtanulja megjósolni a szöveges karakterlánc következő szavát. Az o4-mini azonban egy könnyebb, rugalmasabb verzió, amelyet mélyadatokon tanítanak és emberek finomhangolnak – így olyan matematikai problémákba is belemerülhet, amelyeket a korábbi modellek nem tudtak elérni.
Az o4-mini képességeinek teszteléséhez az OpenAI felkérte az Epoch AI-t, egy LLM-modellek tesztelésére szakosodott nonprofit szervezetet, hogy 300 korábban publikálatlan matematikai kérdést alkosson. Míg a hagyományos LLM-ek számos összetett problémát képesek megoldani, amikor teljesen új kérdésekkel szembesítették őket, a legtöbbjük kevesebb mint 2%-ot ért el helyesen, ami arra utal, hogy nem voltak igazán képesek a logikus gondolkodásra.
Az Epoch AI az új értékelési projektben a fiatal matematikust, Dr. Elliot Glazert toborozta vezetőnek. Az új, FrontierMath névre keresztelt projekt 2024 szeptemberétől indul.
A projekt négy nehézségi szinten gyűjt új kérdéseket, az alapképzéstől a mesterképzésen át a haladó kutatásig. 2025 áprilisára Glazer rájött, hogy az o4-mini a problémák körülbelül 20%-át képes megoldani. Így egészen a 4. szintig jutott – olyan problémák megoldását kérte tőle, amelyekkel még a haladó matematikusok is nehezen boldogulnának.
A résztvevőket titoktartási megállapodás aláírására kényszerítették, és csak a titkosított Signal alkalmazáson keresztül kommunikálhattak, mivel az e-mail használata lehetővé tehette az LLM számára, hogy beolvassa és „szippantsa” a tartalmat, ezáltal meghamisítva az értékelési adatokat.
Minden olyan probléma, amit az o4-mini nem tud megoldani, 7500 USD nyereményt hoz a kérdezőnek.
A kezdeti csapat lassú, de biztos haladást ért el a kérdések kidolgozásában. Glazer azonban úgy döntött, hogy felgyorsítja a folyamatot, és május 17–18-án személyes találkozót tartott. A 30 résztvevő matematikust hatfős csoportokra osztották, akik egymással versenyeztek – nem azért, hogy olyan problémákat oldjanak meg, hanem azért, hogy olyan problémákat találjanak ki, amelyeket a mesterséges intelligencia nem tudott megoldani.
Május 17-én estére Ken Ono kezdett frusztrált lenni a chatbot miatt, amely messze a vártnál magasabb szintű matematikai jártasságot mutatott, ami megnehezítette a csapat számára a „csapdába ejtését”. „Kitaláltam egy olyan problémát, amelyet a terület szakértői a számelmélet nyitott problémájaként ismernének fel – egy olyan problémát, amely PhD-dolgozathoz is alkalmas lenne” – mondta.
Ennek eredményeként, amikor megkérdezte az o4-minit, megdöbbentő volt látni, hogy a chatbot mindössze 10 perc alatt elemzi, érvel, és előáll a helyes megoldással. Pontosabban, az első két percben megtanulta és megértette az összes releváns dokumentumot. Ezután azt javasolta, hogy próbálja ki a probléma egy egyszerűbb változatát, hogy megtanulja, hogyan közelítse meg.
Öt perccel később a chatbot megadta a helyes választ, magabiztos – sőt arrogáns – hangnemben. „Kezdett szemtelenné válni” – mondja Ono –, „és hozzátette: »Nem kell idézet, mert rájöttem a titkos számra!«”
Miután a mesterséges intelligencia legyőzte, Ono május 18-án kora reggel azonnal figyelmeztető üzenetet küldött a csapatnak a Signal segítségével. „Teljesen felkészületlen voltam egy ilyen modellel való foglalkozni” – mondta. „Még soha nem láttam ilyen gondolkodást számítógépes modellben. Úgy gondolkodott, ahogy egy igazi tudós gondolkodna. És ez ijesztő volt.”
Bár a matematikusoknak végül sikerült 10 olyan kérdést találniuk, amelyek meglepték az o4-minit, még mindig nem tudták leplezni a megdöbbenésüket a mesterséges intelligencia mindössze egy év alatt elért fejlődési sebessége miatt.
Ono az o4-minivel való együttműködés élményét egy nagyon tehetséges kollégával való együttműködéshez hasonlítja. Yang Hui He, a London Institute of Mathematical Sciences matematikusa és a mesterséges intelligencia matematikai alkalmazásának úttörője így nyilatkozott: „Erre képes egy nagyon-nagyon tehetséges PhD-hallgató – sőt, még többre is.”
És meg kell jegyezni, hogy a mesterséges intelligencia sokkal gyorsabban végzi el ezt, mint az emberek. Míg az embereknek hetekbe vagy hónapokba telik megoldani, az o4-mini csak néhány percet vesz igénybe.
Az o4-mini körüli izgalom nem mentes aggályoktól. Ono és He is arra figyelmeztetnek, hogy az o4-mini képességei túlzott önbizalommal tölthetik el az embereket. „Van bizonyításunk indukcióval, bizonyítás ellentmondással, és most már bizonyításunk is… elsöprő erejű” – mondja He. „Ha valamit kellő magabiztossággal mondasz, az emberek megijednek. Azt hiszem, az o4-mini elsajátította ezt a fajta bizonyítást: mindent nagy magabiztossággal mond.”
A találkozó végén a matematikusok elkezdtek gondolkodni a matematika jövőjén. Megvitatták egy „ötödik szint” lehetőségét – olyan kérdéseket, amelyeket még a világ legjobb matematikusai sem tudnak megoldani. Ha a mesterséges intelligencia eléri ezt a küszöböt, a matematikusok szerepe drámaian megváltozik: talán kérdezőkké válnak, akik interakcióba lépnek a mesterséges intelligenciával, és irányítják annak érvelését új matematikai igazságok felfedezése érdekében – hasonlóan ahhoz, ahogyan egy professzor egy végzős hallgatóval dolgozik.
„Már régóta mondogatom a kollégáimnak, hogy hatalmas hiba lenne azt gondolni, hogy az általános mesterséges intelligencia soha nem fog megvalósulni, hogy ez csak egy számítógép” – mondta Ono. „Nem akarok pánikba esni, de bizonyos szempontból ezek a nagy nyelvi modellek már most kezdik felülmúlni a világ legjobb PhD-hallgatóinak többségét.”
Forrás: https://www.vietnamplus.vn/cuoc-gap-go-dac-biet-noi-cac-nha-toan-hoc-tim-cach-danh-bai-tri-tue-nhan-tao-post1043183.vnp
Hozzászólás (0)