Das Technologieunternehmen Google (im Besitz von Alphabet) und das KI-Unternehmen OpenAI haben gerade bekannt gegeben, dass ihre KI-Modelle bei der Internationalen Mathematik-Olympiade (IMO), einem prestigeträchtigen Wettbewerb für Gymnasiasten, das Äquivalent einer Goldmedaille erreicht haben.
Dies ist das erste Mal, dass ein KI-System die Goldmedaillenschwelle überschritten hat. Dies stellt einen Durchbruch in der mathematischen Leistungsfähigkeit im Wettlauf um den Aufbau leistungsstarker Systeme dar, die es mit der menschlichen Intelligenz aufnehmen können.
Die Modelle beider Unternehmen lösten fünf von sechs Problemen. Dies gelang durch die Verwendung allgemeiner „Inferenz“-Modelle, die mathematische Konzepte in natürlicher Sprache verarbeiten – eine Abkehr von früheren spezialisierten Ansätzen von KI-Unternehmen.
Dieser Erfolg zeige, dass Mathematiker KI in weniger als einem Jahr nutzen könnten, um ungelöste Forschungsprobleme in Grenzbereichen zu lösen, sagt Junehyuk Jung, Mathematikprofessor an der Brown University und Gastwissenschaftler beim Google-eigenen KI-Unternehmen DeepMind.
Junehyuk Jung, der 2003 die IMO-Goldmedaille gewann, erklärte, dass der Moment, in dem Menschen schwierige Denkprobleme mithilfe natürlicher Sprache lösen können, das Potenzial für eine Zusammenarbeit zwischen KI und Mathematikern eröffnen wird.
Der Durchbruch von OpenAI wurde mit einem neuen Testmodell erzielt, das sich auf die Skalierung der „Berechnung zum Zeitpunkt des Tests“ konzentriert.
Dies wird dadurch erreicht, dass das Modell längere Denkzeiten hat und parallele Rechenleistung eingesetzt wird, um mehrere Inferenz-Threads gleichzeitig auszuführen, so Noam Brown, Forscher bei OpenAI. Brown wollte die Kosten der Rechenleistung nicht nennen, bezeichnete den Prozess aber als „sehr teuer“.
Für die Forscher von OpenAI ist dies ein klares Zeichen dafür, dass KI-Modelle über tiefgreifende Denkfähigkeiten verfügen und auf andere Bereiche als die Mathematik ausgeweitet werden können.
Dieser Optimismus wird auch von den Google-Forschern geteilt, die davon überzeugt sind, dass die Leistungsfähigkeit von KI-Modellen auf schwierige Forschungsprobleme in anderen Bereichen wie der Physik angewendet werden kann.
Beim 66. IMO in Queensland, Australien, erreichten von 630 teilnehmenden Studenten 67 Kandidaten (etwa 11 %) Goldmedaillen.
Im Jahr 2024 gewann Googles DeepMind-Einheit eine Silbermedaille mit auf Mathematik spezialisierten KI-Systemen. In diesem Jahr verwendete Google ein Allzweckmodell namens Gemini Deep Think, dessen Version auf der jährlichen Entwicklerkonferenz im Mai 2025 vorgestellt wurde.
Im Gegensatz zu früheren Versuchen, die auf formalen Sprachen und langwierigen Berechnungen basierten, arbeitete Googles Methode dieses Jahr vollständig mit natürlicher Sprache und löste die Probleme innerhalb des offiziellen Zeitlimits von 4,5 Stunden für den Wettbewerb.
Auch OpenAI baute einen ähnlichen Prototypen für den Wettbewerb. OpenAI-Forscher Alexander Wei erklärte im sozialen Netzwerk X, dass das Unternehmen in den nächsten Monaten keine Produkte mit diesem mathematischen Niveau auf den Markt bringen werde.
In diesem Jahr hat die IMO erstmals offiziell mit einer Reihe von KI-Entwicklern zusammengearbeitet. Die IMO-Jury zertifizierte die Ergebnisse von Unternehmen, darunter Google, und gestattete den beteiligten Unternehmen, diese später zu veröffentlichen.
Quelle: https://www.vietnamplus.vn/cac-mo-hinh-ai-cua-google-va-openai-chien-thang-trong-cuoc-thi-toan-the-gioi-post1051014.vnp
Kommentar (0)