Menschen sind intelligenter als KI.

Google DeepMind und OpenAI gewannen Goldmedaillen bei der Mathematik-Olympiade, aber die amerikanischen Teenager im Team erzielten trotzdem höhere Punktzahlen als diese beiden Maschinen.

ZNews•10/08/2025

Die IMO 2025 fand vom 10. bis 20. Juli an der Sunshine Coast in Queensland, Australien, mit 630 Teilnehmern statt. Davon gewannen 67 (rund 11 %) Goldmedaillen. Dass AI ebenfalls einen ähnlichen Erfolg erzielte, ist ein historischer Meilenstein.

Dies ist das erste Jahr, in dem der IMO-Wettbewerb offiziell mit mehreren KI-Entwicklern zusammenarbeitet. Die IMO-Jury hat die Ergebnisse der Partnerunternehmen, darunter Google, bestätigt und diese gebeten, die Ergebnisse bis zum 28. Juli zu veröffentlichen.

Die Endergebnisse zeigten jedoch, dass selbst die fortschrittlichsten und modernsten Maschinen von den klügsten Teenagern der Welt geschlagen werden konnten.

Die letzte Mauer der Menschheit?

Die berüchtigte, anspruchsvolle IMO-Prüfung erstreckt sich über zwei Tage. An jedem Tag müssen die Schüler innerhalb von etwas mehr als vier Stunden drei zunehmend komplexere Aufgaben lösen. Die Aufgaben umfassen Algebra, Geometrie, Zahlentheorie und Kombinatorik.

Aufgrund seiner komplexen und unkonventionellen Aufgabenstellungen hat sich der jährliche Mathematiktest zu einem nützlichen Instrument entwickelt, um die Fortschritte der KI Jahr für Jahr zu messen. In dieser Ära rasanter Entwicklung träumen führende Forschungslabore von dem Tag, an dem ihre Systeme leistungsstark genug sind, um sich für eine Goldmedaille bei der Internationalen Mathematik-Weltmeisterschaft (IMO) zu qualifizieren.

Obwohl dieses Ziel mit dem Gewinn der Goldmedaillen für die KI von Google und OpenAI erreicht wurde, ist es bemerkenswert, dass 26 Studenten höhere Punktzahlen erzielten.

Unter ihnen befinden sich vier Stars des US-Teams, darunter Qiao Zhang, zweifacher Goldmedaillengewinner, und Alexander Wang, der New Jersey die dritte Goldmedaille in Folge sicherte. Mit diesem Erfolg zählt Wang zu den herausragendsten jungen Mathematikern aller Zeiten und könnte im nächsten Jahr bei der IMO eine weitere Goldmedaille gewinnen.

Das US-Team bei der Internationalen Mathematik-Olympiade 2025. Foto: WSJ.

Im Gespräch mit dem WSJ erklärte Zhang, dass er während der Prüfung am längsten für Aufgabe 6 gebraucht habe. Dabei handelt es sich um ein bekanntermaßen schwieriges kombinatorisches Problem, das einen Teilbereich der Mathematik umfasst, der sich mit dem Zählen, Sortieren und Kombinieren diskreter Objekte befasst.

Die Lösung dieses Problems erfordert Einfallsreichtum, Kreativität und Intuition – Fähigkeiten, die Menschen nutzen können, Maschinen aber nicht, zumindest noch nicht. „Ich wäre ehrlich gesagt etwas beunruhigt, wenn KI-Modelle Problem 6 lösen könnten“, sagte Zhang.

Aufgabe Nummer 6 stellte die Modelle von DeepMind und OpenAI vor große Herausforderungen, doch nicht nur die KI hatte damit zu kämpfen. Von den 630 Teilnehmern erhielten 569 null Punkte. Nur sechs erreichten die Höchstpunktzahl von sieben Punkten. Zhang, stolz auf seine Teillösung, erzielte vier Punkte und damit mehr als die meisten anderen Teilnehmer.

Aufgrund der ständigen Fortschritte wurde oft die Befürchtung geäußert, dass KI die Menschheit in der Mathematik „zerstören“ könnte. Junehyuk Jung widerspricht dieser Ansicht jedoch.

Jung, ein ehemaliger Goldmedaillengewinner der Internationalen Moderate-Bewegung (IMO), ist derzeit außerordentlicher Professor an der Brown University und Gastforscher bei DeepMind. Er glaubt jedoch nicht, dass dies die letzte Schlacht der Menschheit ist. Laut Jung werden Probleme wie Problem 6 die KI noch mindestens ein weiteres Jahrzehnt beschäftigen.

„Es gibt Dinge, die KI sehr gut kann. Es wird aber auch weiterhin Dinge geben, die Menschen besser können“, bemerkte Jung.

Das Goldmedaillenrennen in der Mathematik

Im Jahr 2021 war ein Student namens Alexander Wei Teil eines Forschungsprojekts, in dem er die Aufgabe hatte, die mathematischen Fähigkeiten von KI bis Juli 2025 vorherzusagen. Im Vergleich zu anderen Prognosen hielt Wei diese für zu optimistisch.

Dieser ehemalige Student ist jedoch der lebende Beweis dafür, wie sehr er sich geirrt hat. Wei ist der Wissenschaftler , der das IMO-Projekt für OpenAI leitete. Noch beeindruckender ist, wie sie das geschafft haben.

Nicht nur OpenAI, sondern auch Google bezeichnete die Ergebnisse der IMO 2025 als einen bedeutenden Durchbruch. Im Jahr 2024 mussten KI-Modelle Probleme in Programmiersprachen übersetzen, um mathematische Beweise zu ermöglichen.

Innerhalb nur eines Jahres arbeiteten diese Systeme vollständig in „natürlicher Sprache“ ohne menschliches Eingreifen. DeepMind absolvierte die Prüfung zudem innerhalb der von der IMO vorgegebenen 4,5-Stunden-Frist. Zum Vergleich: Im Jahr 2024 benötigte dieses System mehrere Tage, um die Lösung zu berechnen.

Viele Menschen betrachten KI vielleicht als Konkurrenz. Diejenigen, die die Modelle entwickeln, sehen sie jedoch als komplementäre Werkzeuge.

Endergebnisse der Internationalen Mathematik-Olympiade 2025. Foto: WSJ.

„Dies könnte potenziell ein neuer Computer sein, der die nächste Generation von Mathematikern voranbringen wird“, sagte Dr. Luong Minh Thang, ein leitender Forscher bei Google (USA).

Vor drei Wochen entwickelte das Team von Dr. Minh Thang erfolgreich AlphaGeometry 2. Das bemerkenswerteste Merkmal dieser Version ist ihre Fähigkeit, Geometrieprobleme zu lösen, die selbst die von Goldmedaillengewinnern der Internationalen Mathematik-Olympiade (IMO) übertreffen.

„Wenn Schüler mit Fähigkeiten, die bei der IMO eine Goldmedaille gewonnen haben, 40 von 50 Aufgaben lösen können, dann wird AlphaGeometry 2 in der Lage sein, 42 von 50 Aufgaben zu lösen“ , teilte Dr. Thang erfreut mit.

Im vergangenen Jahr gewann dieses Modell lediglich eine Silbermedaille. Dieses Jahr verwendet Google das Mehrzweckmodell Gemini Deep Think (eine Version, die bereits auf der Entwicklerkonferenz im Mai vorgestellt wurde).

Bemerkenswerterweise nahm das Team von Dr. Thang laut WSJ vor Beginn des Wettbewerbs noch Anpassungen vor. Ursprünglich erwartete Dr. Thang lediglich, dass das DeepMind-Modell alle drei Probleme am ersten Tag lösen würde.

Die Einfachheit, Eleganz und bemerkenswerte Verständlichkeit dieser Lösungen verblüfften die Mathematiker. Als Thang und seine Kollegen am nächsten Tag feststellten, dass das KI-System zwei weitere Probleme gelöst hatte, war ihnen klar, dass sie die Goldmedaille gewinnen konnten.

Infolgedessen löste die KI von DeepMind 5 von 6 Problemen erfolgreich. Bemerkenswert ist, dass alle Lösungen empirische Schlussfolgerungsmodelle nutzten und mathematische Konzepte mithilfe natürlicher Sprache verarbeiteten – ein deutlicher Kontrast zu den komplexen Ansätzen, die KI-Unternehmen zuvor verwendet hatten.

Quelle: https://znews.vn/nhung-nguoi-thong-minh-hon-ai-post1572367.html