OpenAI und Google haben gemeinsam die „Goldmedaille“ bei der IMO-Mathe-Olympiade 2025 gewonnen: Gold gemischt mit Messing?

Die Ergebnisse unterstreichen das rasante Entwicklungstempo von KI-Systemen und zeigen, dass Google und OpenAI im KI-Rennen mittlerweile gleichauf liegen.

KI-Unternehmen konkurrieren hart um den Eindruck, führend zu sein – ein „Krieg der Emotionen“, der einen großen Einfluss auf die Gewinnung von Top-KI-Talenten haben kann. Viele KI-Forscher kommen aus der wettbewerbsorientierten Mathematik, daher sind Meilensteine wie IMO besonders bedeutsam.

Im Jahr 2024 gewann Google bei der IMO eine Silbermedaille mit einem „formalen“ KI-System, bei dem Menschen das Problem in Computersprache übersetzen mussten. In diesem Jahr reichten sowohl OpenAI als auch Google „informelle“ KI-Systeme ein, die ein Problem lesen und eine beweisähnliche Lösung in natürlicher Sprache generieren können.

Beide Unternehmen behaupten, dass ihre KI-Modelle fünf von sechs Fragen richtig beantwortet hätten, dabei bessere Ergebnisse erzielt hätten als die meisten Highschool-Schüler und im letzten Jahr das System von Google übertroffen hätten, ohne die Fragen in Maschinensprache zu übersetzen.

Vertreter von Google DeepMind auf der IMO 2025. (Foto: Google)

In Interviews mit TechCrunch erklärten OpenAI und die IMO-Forscher von Google, dass diese Goldmedaillen-Leistungen einen Durchbruch bei der Entwicklung von KI-Argumentationsmodellen für schwer überprüfbare Bereiche darstellen. Während Argumentationsmodelle bei Fragen mit klaren Antworten, wie einfacher Mathematik oder Programmierung, in der Regel gut abschneiden, haben sie bei höchst mehrdeutigen Aufgaben wie der Wahl eines geeigneten Lehrstuhls oder der Unterstützung komplexer Forschungsarbeiten Schwierigkeiten.

Google hinterfragt jedoch die Vorgehensweise von OpenAI bei der Bekanntgabe seines IMO-Erfolgs. Kurz nachdem OpenAI seinen Erfolg am Morgen des 19. Juli bekannt gegeben hatte, kritisierten der CEO und die Forscher von Google DeepMind OpenAI in den sozialen Medien dafür, dass die Goldmedaille so früh bekannt gegeben wurde – so kurz nachdem die IMO am Vorabend die Ergebnisse der Studenten bekannt gegeben hatte – und weil das OpenAI-Modell noch nicht formell von der IMO evaluiert worden war.

Thang Luong, leitender Forscher bei Google DeepMind und Leiter des IMO-Projekts, sagte gegenüber TechCrunch, dass Google aus Respekt vor den Teilnehmern bis zum 21. Juli mit der Bekanntgabe der Ergebnisse gewartet habe.

Luong sagte, Google habe seit letztem Jahr mit dem Organisationskomitee der IMO zusammengearbeitet, um die Prüfung vorzubereiten. Vor der Bekanntgabe der Ergebnisse wolle man eine Bestätigung und die offiziellen Bewertungskriterien vom IMO-Präsidenten erhalten. „Das Organisationskomitee der IMO hat seine eigenen Bewertungsrichtlinien“, sagte Luong. „Eine Bewertung, die nicht auf diesen Richtlinien basiert, kann daher nicht mit einer Goldmedaille bewertet werden.“

Noam Brown, leitender Forscher bei OpenAI und Mitarbeiter des IMO-Modells, erklärte, die IMO-Organisatoren hätten OpenAI vor einigen Monaten kontaktiert und zur Teilnahme an der offiziellen Prüfung eingeladen. Das Unternehmen habe jedoch abgelehnt, da es sich auf die Entwicklung seines Systems zur Verarbeitung natürlicher Sprache konzentriere. Brown sagte, OpenAI habe nicht gewusst, dass IMO eine informelle Prüfung mit Google durchführe.

OpenAI gab an, eine unabhängige Jury – drei ehemalige IMO-Medaillengewinner – mit der Bewertung seines KI-Modells beauftragt zu haben. Nachdem OpenAI von der Goldmedaille erfahren hatte, kontaktierte das Unternehmen die IMO und wurde angewiesen, mit der Bekanntgabe der Goldmedaille bis nach der Preisverleihung am Abend des 18. Juli zu warten.

IMO hat auf die Bitte von TechCrunch um einen Kommentar nicht geantwortet.

Laut TechCrunch liegt Google nicht ganz falsch: Das Unternehmen hat ein formelleres und strengeres Verfahren durchlaufen, um die Goldmedaille zu erreichen. Die Debatte könnte jedoch den Blick auf das Gesamtbild verstellen: Die KI-Modelle vieler führender Labore verbessern sich rasant. Länder rund um den Globus schickten dieses Jahr ihre besten Studenten zur IMO, doch nur ein verschwindend geringer Prozentsatz von ihnen erreichte das gleiche Ergebnis wie die Modelle von OpenAI und Google.

Während OpenAI seinen Branchenkonkurrenten bisher deutlich voraus zu sein schien, ist das Rennen nun deutlich enger. OpenAI wird voraussichtlich in den kommenden Monaten GPT-5 veröffentlichen, und das Unternehmen ist bestrebt, sein Image als KI-Marktführer zu wahren.

Die 66. Internationale Mathematik-Olympiade fand vom 10. bis 20. Juli in Sunshine Coast, Queensland, Australien, statt. Mehr als 639 Teilnehmer aus 113 Delegationen aus Ländern und Territorien nahmen daran teil. Insgesamt wurden in diesem Jahr 72 Medaillen im Reihenrechnen, 104 Silbermedaillen und 145 Bronzemedaillen gewonnen.
Die Prüfung IMO 2025 besteht aus 6 Aufgaben: 2 Rechenaufgaben, 2 kombinatorische Aufgaben, 1 Geometrieaufgabe und 1 Algebraaufgabe (mit kombinatorischen Aussagen und Anforderungen an kombinatorisches Denken).

(Quelle: Vietnamnet)

Link: https://vietnamnet.vn/openai-va-google-cung-dat-huy-chuong-vang-toan-imo-2025-vang-thau-lan-lon-2424424.html

Quelle: https://vtcnews.vn/openai-va-google-cung-dat-huy-chuong-vang-toan-imo-2025-vang-thau-lan-lon-ar955683.html