Het onderzoek werd op 17 januari gepubliceerd in Nature, een prestigieus wetenschappelijk tijdschrift dat meer dan 150 jaar oud is.
De hoofdauteurs van AlphaGeometry zijn Trinh Hoang Trieu (29), promovendus aan New York University, en Luong Minh Thang (36), promovendus aan Stanford University (VS). Trieu en Thang worden vergezeld door drie andere wetenschappers, waaronder Dr. Le Viet Quoc (42), die bekendstaat als het "AI-genie" bij Google. Dr. Quoc en Thang zijn tevens senior experts bij Google DeepMind, de onderzoeksafdeling voor kunstmatige intelligentie (AI) van Google.
Met 30 meetkundige problemen in de periode 2000-2022 van de Internationale Wiskunde Olympiade (IMO) loste AlphaGeometry er 25 op binnen de voorgeschreven tijd. Een eerder geavanceerd systeem loste daarentegen slechts 10 problemen op, terwijl een IMO-goudmedaillewinnaar gemiddeld 25,9 problemen oploste.
Volgens Google bestaat elke Olympiade uit 6 opgaven, waaronder meestal 2 meetkundeopgaven, waardoor AlphaGeometry slechts 1/3 van de opgaven aankan. Als we alleen naar meetkunde kijken, is deze AI vergelijkbaar met de goudenmedaillewinnaars van de IMO. En als we kijken naar het totale aantal opgaven, is dit het eerste AI-model ter wereld dat de bronzenmedaille van de IMO 2000 en 2015 heeft overtroffen.
Veel AI-experts en wiskundigen beschouwen dit als een indrukwekkend resultaat.
"Het is volkomen logisch dat AI-onderzoekers zich wagen aan IMO-geometrieproblemen, want het vinden van oplossingen daarvoor lijkt een beetje op schaken, in die zin dat we bij elke stap maar heel weinig redelijke zetten hebben. Maar ik ben nog steeds verbaasd dat ze het kunnen," aldus professor Ngo Bao Chau.
Probleem 3 van de IMO 2025-wedstrijd opgelost door AlphaGeometry. Foto: Aangeleverd door het personage.
AlphaGeometry combineert een neuraal taalmodel met goede redeneercapaciteiten en een symbolische engine die gespecialiseerd is in logisch redeneren. Deze engine wordt vervolgens aangepast om geometrie te begrijpen.
Eerst wordt het neurale netwerk getraind met data, algoritmisch samengesteld met 100 miljoen voorbeelden van geometrische bewijzen zonder menselijke oplossingen. Wanneer AlphaGeometry een probleem begint op te lossen, start de symbolische engine als eerste. Als deze vastloopt, stelt het neurale netwerk andere manieren voor om te helpen.
Dit proces heet 'sub-pointing': een lijn toevoegen, een hoek in tweeën delen, een deelcirkel tekenen... net zoals een mens een meetkundeopgave zou oplossen. De lus gaat door totdat het antwoord is gegeven of totdat de 4,5 uur, de tijd die is toegewezen voor opgaven in het IMO-examen, voorbij zijn.
Het bijzondere aan deze AI, aldus de drie promovendi, is dat de invoergegevens volledig kunstmatig zijn. Trieu gaf aan dat AlphaGeometry hoogwaardige data genereert, goed genoeg om een bepaalde prestatie te behalen zonder data te trainen met menselijke oplossingen. Dit is iets wat andere AI-tools zoals ChatGPT of Gemini niet hebben kunnen doen.
"Simpel gezegd genereert AlphaGeometry oplossingen uit het niets. Huidige AI-modellen zullen zoeken naar beschikbare of vergelijkbare menselijke oplossingen", aldus Dr. Thang.
Het team creëerde ook een systeem, bestaande uit een combinatie van systeem 1 (snelle, automatische, onbewuste reactie) en systeem 2 (trage, logische reactie). Dit is heel normaal, maar in combinatie met kunstmatige data zorgt het voor een doorbraak.
Drie Vietnamese promovendi bij Google DeepMind (van rechts naar links): Le Viet Quoc, Trinh Hoang Trieu en Luong Minh Thang. Foto: Aangeleverd door het personage.
Trieu kreeg het idee voor AlphaGeometry in 2019, toen hij op zoek was naar een onderwerp voor zijn afstudeeronderzoek aan de New York University.
"Ik denk terug aan de middelbare school. Ik vond het erg leuk om meetkundeopgaven te maken, maar was niet goed genoeg om het staatsexamen te halen. Dus besloot ik me erin te verdiepen, aanvankelijk alleen een model dat eenvoudige wiskundige problemen kon oplossen," herinnert de inwoner van Quy Nhon zich.
Quoc en Thang, oorspronkelijk studenten die wiskunde studeerden aan de Quoc Hoc Hue High School en Gifted High School in Ho Chi Minhstad, waren al snel gecharmeerd van Trieu's idee. Trieu ging vervolgens bij Google DeepMind werken, waar hij sinds 2021 werkt.
In juli 2022, na 10 versies, had AlphaGeometry zijn eerste meetkundeprobleem opgelost. De doorbraak van het team kwam drie maanden later, toen het een meetkundeprobleem bij de IMO oploste.
Volgens Dr. Trieu kan de door de groep gecreëerde AI worden gebruikt als een begeleidingssysteem dat middelbare scholieren ondersteunt bij het leren van meetkunde.
Tijdens de test was Evan Chen, promovendus wiskunde aan het MIT en winnaar van de IMO-goudmedaille in 2014, verrast door de effectiviteit van deze AI. Chen zei dat een computerprogramma normaal gesproken meetkundige problemen oplost met behulp van coördinatensystemen en algebra, maar AlphaGeometry gebruikt zuivere geometrische regels, met vergelijkbare hoeken en driehoeken, net als studenten.
"Ik was benieuwd hoe AlphaGeometry dit heeft bereikt", aldus Chen.
Dr. Le Ba Khanh Trinh (midden) lost probleem nummer 3 op op IMO 2015. Foto: Wendy Nguyen
Een maand geleden, bij terugkeer naar de Gifted High School, stuurde Dr. Thang Dr. Le Ba Khanh Trinh de AI-oplossing voor probleem nummer 3 van de IMO 2015. Dit is een van de moeilijkste meetkundige problemen van de IMO. AlphaGeometry gaf het antwoord na 109 stappen.
"Meneer Trinh was onder de indruk omdat het met behulp van zeer eenvoudige regels werd opgelost, maar hij was niet erg tevreden omdat de oplossingen, volgens hem, ziel, een zekere schoonheid en een onderlinge verbinding moesten hebben," vertelde meneer Thang. Dr. Trinh gebruikte vervolgens de inversiemethode, die het resultaat na ongeveer 20-30 stappen opleverde. Meneer Trinh won de gouden medaille op de IMO van 1979 met een perfecte score, en was tevens de enige Vietnamees die een speciale prijs won op een IMO-wedstrijd, met een mooie en beknopte oplossing voor een meetkundig probleem.
Het team zegt dat dit een manier zou kunnen zijn om AlphaGeometry verder te verbeteren. Ze hopen ook dat de volgende stappen van deze AI mensen kunnen helpen de 7 Millennium Problemen op te lossen.
Dit is wat Dr. Le Viet Quoc ooit als een "onmogelijk vooruitzicht" beschouwde, omdat AI heel goed éénstapsproblemen kan oplossen, terwijl wiskundige problemen vaak honderden stappen hebben.
Het "AI-genie" bij Google zei trots te zijn dat het onderzoek van Vietnamese ingenieurs gepubliceerd is in Nature, het meest prestigieuze internationale tijdschrift. Volgens hem kan AI wiskundige problemen oplossen en de mensheid vooruit helpen.
"Omdat wiskunde de taal van wetenschap en technologie is. Wiskunde beoefenen is dé manier om de ontwikkeling van deze vakgebieden te bevorderen", aldus de heer Quoc.
Doan Hung
Reactie (0)