El 28 de noviembre, la empresa china de inteligencia artificial (IA) DeepSeek anunció el modelo de IA DeepSeekMath-V2, que se considera un gran avance en el campo del razonamiento matemático de IA, que establece nuevos estándares de rendimiento y amplía los límites de las capacidades de resolución de problemas mediante el aprendizaje automático.
El código fuente de DeepSeekMath-V2 está disponible públicamente en Hugging Face y GitHub.
El modelo integra un marco de autoverificación para comprobar la validez de una cadena de argumentos, además de generar respuestas correctas, algo con lo que muchos modelos de IA actuales todavía tienen dificultades.
Los resultados de la evaluación muestran que DeepSeekMath-V2 está calificado para medallas de oro en la Olimpiada Internacional de Matemáticas de 2025 (OIM) y la Olimpiada China de Matemáticas de 2024 (OCM).
Cabe destacar que el modelo obtuvo 118/120 puntos en el examen Putnam de 2024, superando ampliamente la marca de 90 puntos, el récord más alto jamás alcanzado por los humanos.
Las capacidades de razonamiento lógico del modelo se prueban utilizando el sistema IMO-ProofBench, un punto de referencia dedicado que se utiliza para verificar la precisión del razonamiento de los modelos de IA.
DeepSeekMath-V2 demuestra un rendimiento superior en comparación con muchos otros modelos de última generación, incluido DeepThink de DeepMind.
IMO-ProofBench funciona con un mecanismo de verificación cruzada: un modelo asume el papel de “probar” y generar una cadena de argumentos matemáticos, mientras que el otro modelo asume el papel de “validar” y evaluar la solidez del argumento.
Este mecanismo permite detectar errores en el pensamiento del modelo, una debilidad inherente de los sistemas de IA contemporáneos.
Según el equipo de desarrollo, el método de autoverificación de DeepSeekMath-V2 ayuda a resolver la mayor limitación de los modelos de IA actuales: la capacidad de generar respuestas correctas pero basadas en razonamientos incorrectos o inconsistentes.
DeepSeek cree que estos avances demuestran que el enfoque de "razonamiento matemático autoverificante" tiene el potencial de convertirse en la base fundamental para una generación de IA matemática más poderosa, confiable y transparente en el futuro.
Fuente: https://www.vietnamplus.vn/deepseek-phat-trien-mo-hinh-ai-lap-luan-toan-hoc-co-kha-nang-tu-kiem-chung-post1079916.vnp






Kommentar (0)