Technologiebedrijf Google (eigendom van Alphabet) en het technologiebedrijf voor kunstmatige intelligentie OpenAI hebben zojuist bekendgemaakt dat hun modellen voor kunstmatige intelligentie (AI) een gouden medaille hebben gewonnen op de Internationale Wiskunde Olympiade (IMO), een prestigieuze wedstrijd voor middelbare scholieren.
Dit is de eerste keer dat een AI-systeem de gouden medaille-drempel heeft overschreden. Dit is een doorbraak op het gebied van wiskundige vaardigheden in de race om krachtige systemen te bouwen die de menselijke intelligentie kunnen evenaren.
De modellen van beide bedrijven losten vijf van de zes problemen op. Ze deden dit door gebruik te maken van algemene 'inferentie'-modellen die wiskundige concepten in natuurlijke taal verwerken. Dit wijkt af van eerdere, gespecialiseerde benaderingen van AI-bedrijven.
Deze prestatie laat zien dat het minder dan een jaar duurt voordat wiskundigen AI kunnen inzetten om onopgeloste onderzoeksproblemen in grensverleggende vakgebieden op te lossen, aldus Junehyuk Jung, hoogleraar wiskunde aan de Brown University en gasthoogleraar bij het AI-bedrijf DeepMind van Google.
Junehyuk Jung, die in 2003 de IMO Gold Medal won, gaf aan dat het moment waarop mensen moeilijke redeneerproblemen kunnen oplossen met behulp van natuurlijke taal, mogelijkheden biedt voor samenwerking tussen AI en wiskundigen.
De doorbraak van OpenAI kwam tot stand met een nieuw testmodel dat zich richt op het opschalen van 'berekeningen tijdens het testen'.
Dit wordt bereikt door het model langere tijd te laten nadenken en parallelle rekenkracht in te zetten om meerdere inferentiethreads tegelijk uit te voeren, aldus Noam Brown, onderzoeker bij OpenAI. Brown weigerde de kosten van de rekenkracht bekend te maken, maar noemde het een "zeer duur" proces.
Voor OpenAI-onderzoekers is dit een duidelijk teken dat AI-modellen over diepgaande redeneercapaciteiten kunnen beschikken en kunnen worden uitgebreid naar andere gebieden dan wiskunde.
Dit optimisme wordt ook gedeeld door Google-onderzoekers, die ervan overtuigd zijn dat de kracht van AI-modellen kan worden toegepast op moeilijke onderzoeksproblemen in andere vakgebieden, zoals de natuurkunde.
Tijdens de 66e IMO in Queensland, Australië, behaalden van de 630 deelnemende studenten 67 kandidaten (ongeveer 11%) een gouden medaille.
In 2024 behaalde Google's DeepMind-eenheid een zilveren medaille met AI-systemen die gespecialiseerd zijn in wiskunde. Dit jaar gebruikte Google een algemeen model genaamd Gemini Deep Think, waarvan een versie werd geïntroduceerd tijdens de jaarlijkse ontwikkelaarsconferentie in mei 2025.
In tegenstelling tot eerdere pogingen, die afhankelijk waren van formele talen en langdurige berekeningen, werkte de methode van Google dit jaar volledig in natuurlijke taal en loste de problemen op binnen de officiële tijdslimiet van 4,5 uur van de wedstrijd.
OpenAI bouwde ook een soortgelijk prototype voor de concurrentie. OpenAI-onderzoeker Alexander Wei merkte op sociaal netwerk X op dat het bedrijf geen plannen heeft om in de komende maanden producten met dit niveau van wiskundige bekwaamheid op de markt te brengen.
Dit jaar is het ook de eerste keer dat IMO officieel samenwerkt met een aantal AI-ontwikkelaars. De IMO-jury certificeerde de resultaten van bedrijven, waaronder Google, en stond de samenwerkende bedrijven toe de resultaten later te publiceren.
Bron: https://www.vietnamplus.vn/cac-mo-hinh-ai-cua-google-va-openai-chien-thang-trong-cuoc-thi-toan-the-gioi-post1051014.vnp
Reactie (0)