
Un modèle d'IA résout des questions de l'Olympiade internationale de mathématiques (OIM).
L'IA peut désormais non seulement résoudre des problèmes mathématiques courants, mais aussi réussir les Olympiades internationales de mathématiques (OIM). Lors d'un examen simulé organisé par des experts internationaux en 2025, le modèle AlphaMath de DeepMind a obtenu un score parfait et remporté la médaille d'or.
Un modèle d'IA obtient la note parfaite à l'Olympiade de simulation mathématique
Un nouveau modèle d'intelligence artificielle appelé AlphaMath , développé par DeepMind en collaboration avec une équipe de recherche d'OpenAI, vient d'obtenir un score parfait à l'examen de simulation des Olympiades internationales de mathématiques (OIM).
Ce n’est pas la première fois que l’IA résout un problème complexe, mais c’est la première fois qu’un système est capable d’exécuter un raisonnement logique avec autant de clarté et de cohérence qu’un véritable concurrent le ferait pour remporter une médaille d’or.
AlphaMath n'utilise pas de techniques de résolution de problèmes de type algèbre de programmation comme Wolfram Alpha, ni ne repose uniquement sur la prédiction du mot suivant comme les modèles de langage actuels. Il utilise plutôt une combinaison de réseaux neuronaux profonds et de logique symbolique, une approche connue sous le nom de raisonnement neuro-symbolique.
Grâce à cela, AlphaMath peut comprendre les problèmes décrits en langage naturel, les décomposer en étapes logiques précises, puis présenter la solution complète sous forme de démonstration mathématique.
Ce qui est remarquable dans la conception d'AlphaMath, c'est qu'elle entraîne le modèle non seulement sur des solutions correctes, mais aussi sur des millions de solutions incorrectes, ainsi que sur les étapes de correction des erreurs. Ce processus permet au système d'apprendre à détecter les erreurs logiques, à évaluer la pertinence des hypothèses et à ajuster la direction de la solution à chaque étape.
Il s'agit d'un passage de l'apprentissage par la « mémorisation de modèles » à un apprentissage par la « pensée critique structurée », ce qui permet au modèle non seulement de résoudre correctement les problèmes, mais aussi de contrôler le processus de raisonnement comme un mathématicien professionnel.
Lors d'un test avec une simulation d'examen OIM, AlphaMath a démontré sa capacité à analyser le problème lui-même, à rétablir les hypothèses, à élaborer une approche, à critiquer sa propre solution et enfin à présenter la solution sous forme de texte intégrant des formules, comme le font généralement les véritables concurrents des OIM.
C’est la première fois qu’un système d’IA a non seulement trouvé la réponse , mais a également reproduit le processus de raisonnement de manière si complète et convaincante qu’il peut être évalué comme un véritable examen manuscrit.
L'essor de l'IA raisonnante : de la résolution de problèmes mathématiques à la conception des connaissances
Le succès d'AlphaMath démontre non seulement les nouvelles capacités de l'IA en mathématiques, mais étend également la capacité des ordinateurs à accéder à des espaces de connaissances hautement structurés qui n'étaient auparavant accessibles qu'aux humains.
La capacité à comprendre les problèmes, à analyser la logique, à construire des preuves et à s'auto-évaluer suggère que l'IA se rapproche de la capacité à manipuler les connaissances formelles, l'un des grands défis de l'intelligence artificielle.
AlphaMath ne fonctionne pas comme un ordinateur numérique traditionnel. Ce modèle comprend le langage naturel et l'utilise pour créer des structures de raisonnement mathématique organisées.
Il s'agit d'un progrès majeur qui permet à l'intelligence artificielle non seulement de lire et de répondre, mais aussi de construire son propre système de pensée vérifiable. Lorsque le raisonnement est modélisé et automatisé , l'IA aidera non seulement les humains à trouver des réponses, mais pourra également contribuer à la détection d'erreurs de programmation, à la démonstration de théorèmes, à la conception de microprocesseurs ou à la recherche en physique théorique.
La particularité d'AlphaMath réside dans le fait qu'il ne se contente pas de traiter des formules mathématiques en entrée, mais qu'il travaille directement avec l'énoncé du problème, à l'instar d'un étudiant qui, face à un sujet d'examen, commence à réfléchir. Ceci favorise une meilleure interopérabilité entre l'IA et les domaines académiques, où le langage et le raisonnement sont des outils essentiels, et non le simple calcul.
Bien qu'AlphaMath ne puisse pas encore générer de nouveaux problèmes ni découvrir de concepts mathématiques créatifs, ce qui requiert l'intuition et l'expérience humaines, l'obtention d'un score parfait à l'examen simulé des OIM est un signal clair que l'IA entre dans une nouvelle phase où elle ne se contente plus de répondre, mais sait aussi raisonner de manière systématique.
Et c'est sur ce fondement que reposeront les futures générations d'IA spécialisées, où la logique ne sera plus un privilège humain.
Source : https://tuoitre.vn/ai-giai-de-olympic-toan-quoc-te-the-nao-ma-gianh-huy-chuong-vang-20250725180121618.htm






Comment (0)