Resolver problemas complejos con lenguaje natural, soluciones y argumentos claros y coherentes no es fácil, ni siquiera para estudiantes con buenas habilidades matemáticas. Sin embargo, DeepSeek ha creado un modelo de IA, DeepSeekMath-V2, capaz de lograrlo.

DeepSeek impresionó al crear un modelo de IA capaz de resolver problemas de nivel de examen internacional (Ilustración: IA).
En las evaluaciones, DeepSeekMath-V2 logró puntajes de nivel de medalla de oro en la resolución de problemas en la Olimpiada Internacional de Matemáticas de 2025 (OIM) y la Olimpiada China de Matemáticas de 2024 (OCM).
Al participar en la prueba IMO-ProofBench para evaluar las capacidades de interpretación matemática y razonamiento de los modelos de IA, DeepSeekMath-V2 de DeepSeek logró puntuaciones sobresalientes en comparación con otros modelos de IA como DeepMind de Google, Grok de xAI o GPT-5 de OpenAI...
Cabe destacar que el modelo de IA de DeepSeek también obtuvo una puntuación de 118/120 al resolver la Competencia de Matemáticas de Putnam en 2024, mientras que la persona con mayor clasificación en esta competencia solo obtuvo 90. La Competencia de Putnam se considera la competencia de matemáticas más difícil y prestigiosa del mundo para estudiantes universitarios y se celebra cada diciembre.
Muchos problemas en competiciones internacionales a veces no requieren una respuesta numérica exacta, sino que la puntuación se basa en el razonamiento utilizado para llegar a la solución. Sin embargo, DeepSeekMath-V2 aún demuestra la capacidad de razonar con precisión en lenguaje natural, como los humanos, lo que ayuda a este modelo de IA a obtener una alta puntuación.
DeepSeek afirma que, para ayudar a su modelo de IA a generar respuestas precisas y argumentos sólidos, construyó dos grandes modelos de lenguaje y los comparó. Un modelo actúa como "comprobador" para generar argumentos y pruebas matemáticas, mientras que el otro actúa como "juez" para verificar los argumentos presentados.
Esta forma de trabajar ayuda a eliminar hipótesis y argumentos débiles, centrándose en optimizar la solución para encontrar la respuesta correcta y argumentar con solidez.
DeepSeekMath-V2 se desarrolla como código abierto, lo que permite a la comunidad modificar el código fuente y usarlo para diversos propósitos.
DeepSeek afirma que los avances logrados con DeepSeekMath-V2 sentarán las bases para construir sistemas de IA matemática más potentes y confiables.
DeepSeek es una empresa tecnológica china que causó sensación a nivel mundial cuando lanzó el modelo AI R1 a finales de enero, proporcionando una velocidad de respuesta rápida y precisa.
Lo más destacado de R1 es que DeepSeek solo gastó alrededor de 6,5 millones de dólares para desarrollar y entrenar este modelo de IA, en lugar de tener que gastar miles de millones de dólares como las empresas de tecnología estadounidenses para entrenar y operar sus propios modelos de IA.
Además, DeepSeek desarrolló y operó el R1 con chips de IA de generación anterior, ya que las empresas chinas, sujetas al embargo del gobierno estadounidense, no pueden adquirir chips de IA de alta gama. Sin embargo, el R1 aún muestra una capacidad de procesamiento y una velocidad de respuesta impresionantes a las solicitudes de los usuarios.
La aparición de DeepSeek ha provocado que Estados Unidos pierda su monopolio en la carrera por el desarrollo de modelos de IA, a la vez que ha abierto una nueva etapa. En lugar de centrarse únicamente en la inteligencia y las capacidades de procesamiento, las empresas tecnológicas han comenzado a prestar más atención a la eficiencia económica en el proceso de desarrollo de modelos de IA.
Fuente: https://dantri.com.vn/cong-nghe/deepseek-ra-mat-cong-cu-ai-co-kha-nang-gianh-hcv-ky-thi-toan-quoc-te-20251130154751624.htm






Kommentar (0)