Die Ergebnisse unterstreichen das rasante Entwicklungstempo von KI-Systemen und zeigen, dass Google und OpenAI im KI-Rennen nun gleichauf liegen.
KI-Unternehmen konkurrieren hart um den Eindruck, führend zu sein – ein „Krieg der Emotionen“, der die Gewinnung von Top-KI-Talenten maßgeblich beeinflussen kann. Viele KI-Forscher kommen aus der wettbewerbsorientierten Mathematik, daher sind Meilensteine wie die IMO besonders bedeutsam.
Im Jahr 2024 gewann Google bei der IMO eine Silbermedaille mit einem „formalen“ KI-System, bei dem Menschen das Problem in Computersprache übersetzen mussten. In diesem Jahr reichten sowohl OpenAI als auch Google „informelle“ KI-Systeme ein, die ein Problem lesen und eine beweisähnliche Lösung in natürlicher Sprache generieren können.
Beide Unternehmen behaupten, dass ihre KI-Modelle fünf von sechs Fragen richtig beantwortet hätten, dabei bessere Ergebnisse erzielt hätten als die meisten High-School-Schüler und das System von Google im letzten Jahr weit übertroffen hätten, ohne die Fragen in Maschinensprache zu übersetzen.

Vertreter von Google DeepMind auf der IMO 2025. (Foto: Google)
In Interviews mit TechCrunch erklärten OpenAI und Googles IMO-Forscher, diese Goldmedaillen-Leistungen seien ein Durchbruch bei der Entwicklung von KI-Argumentationsmodellen für schwer überprüfbare Bereiche. Während Argumentationsmodelle bei Fragen mit klaren Antworten, wie einfacher Mathematik oder Programmierung, in der Regel gut abschneiden, haben sie bei höchst mehrdeutigen Aufgaben wie der Wahl eines geeigneten Lehrstuhls oder der Unterstützung bei komplexen Forschungsarbeiten Schwierigkeiten.
Google stellt jedoch die Art und Weise in Frage, wie OpenAI seinen IMO-Erfolg durchgeführt und bekannt gegeben hat. Kurz nachdem OpenAI seinen Erfolg am Morgen des 19. Juli bekannt gegeben hatte, kritisierten der CEO und die Forscher von Google DeepMind OpenAI in den sozialen Medien dafür, dass die Goldmedaille so früh – kurz nachdem die IMO am Vorabend die Ergebnisse der Studenten bekannt gegeben hatte – bekannt gegeben wurde und weil das OpenAI-Modell noch nicht formell von der IMO evaluiert worden war.
Thang Luong, leitender Forscher bei Google DeepMind und Leiter des IMO-Projekts, sagte gegenüber TechCrunch, dass Google aus Respekt vor den Teilnehmern bis zum 21. Juli mit der Bekanntgabe der Ergebnisse gewartet habe.
Luong sagte, Google habe seit letztem Jahr mit dem IMO-Organisationskomitee zusammengearbeitet, um den Wettbewerb vorzubereiten. Vor der Bekanntgabe der Ergebnisse wolle man eine Bestätigung und die offiziellen Wertungsergebnisse vom IMO-Präsidenten erhalten. „Das IMO-Organisationskomitee hat seine eigenen Bewertungsrichtlinien“, sagte Luong. „Bewertungen, die nicht auf diesen Richtlinien basieren, können daher nicht mit einer Goldmedaille bewertet werden.“
Noam Brown, leitender Forscher bei OpenAI und Mitentwickler des IMO-Modells, erklärte, die IMO-Organisatoren hätten sich vor einigen Monaten an OpenAI gewandt und das Unternehmen zur Teilnahme an der offiziellen Prüfung eingeladen. Das Unternehmen habe jedoch abgelehnt, da es sich auf die Entwicklung seines Systems zur Verarbeitung natürlicher Sprache konzentriere. Brown sagte, OpenAI habe nicht gewusst, dass die IMO eine informelle Prüfung mit Google durchführe.
OpenAI gab an, ein unabhängiges Gutachtergremium – drei ehemalige IMO-Medaillengewinner – mit der Bewertung seines KI-Modells beauftragt zu haben. Nachdem OpenAI von der Goldmedaille erfahren hatte, kontaktierte das Unternehmen die IMO und wurde angewiesen, mit der Bekanntgabe bis nach der Preisverleihung am Abend des 18. Juli zu warten.
IMO hat auf eine Bitte um Stellungnahme von TechCrunch nicht geantwortet.
Laut TechCrunch liegt Google nicht ganz falsch: Das Unternehmen hat ein formelleres und strengeres Verfahren durchlaufen, um die Goldmedaille zu erhalten. Die Debatte könnte jedoch den Blick auf das Gesamtbild verstellen: KI-Modelle vieler Top-Labore verbessern sich rasant. In diesem Jahr schickten Länder weltweit ihre besten Studenten zur IMO, doch nur ein verschwindender Prozentsatz von ihnen erreichte das gleiche Ergebnis wie die Modelle von OpenAI und Google.
Während OpenAI seinen Branchenkonkurrenten bisher deutlich voraus zu sein schien, wird das Rennen nun deutlich spannender. OpenAI wird voraussichtlich in den kommenden Monaten GPT-5 veröffentlichen, und das Unternehmen ist bestrebt, sein Image als führender KI-Anbieter zu wahren.
Die 66. Internationale Mathematik-Olympiade fand vom 10. bis 20. Juli in Sunshine Coast, Queensland, Australien, statt. Über 639 Teilnehmer aus 113 Delegationen verschiedener Länder und Territorien nahmen daran teil. Insgesamt wurden in diesem Jahr 72 Medaillen im Reihenrechnen, 104 Silbermedaillen und 145 Bronzemedaillen gewonnen.
Die Prüfung IMO 2025 besteht aus 6 Aufgaben: 2 Rechenaufgaben, 2 kombinatorische Aufgaben, 1 Geometrieaufgabe und 1 Algebraaufgabe (mit kombinatorischen Aussagen und Anforderungen an kombinatorisches Denken).
Quelle: https://vtcnews.vn/openai-va-google-cung-dat-huy-chuong-vang-toan-imo-2025-vang-thau-lan-lon-ar955683.html
Kommentar (0)