Este nuevo modelo no sólo desafía el dominio de los gigantes estadounidenses, sino que también reestructura todo el juego con código abierto (imagen ilustrativa: DS).
Este modelo cuenta con 685 mil millones de parámetros y se publica bajo una licencia de código abierto. Los resultados iniciales de las pruebas muestran un rendimiento comparable al de los sistemas propietarios de OpenAI o Anthropic, lo que abre nuevas perspectivas para el desarrollo y la distribución de modelos avanzados de IA.
Rendimiento y coste
Inmediatamente después de su lanzamiento en la plataforma Hugging Face, DeepSeek V3.1 obtuvo una puntuación del 71,6 % en la prueba de programación de Aider. Técnicamente, el modelo es capaz de gestionar contextos con hasta 128 000 tokens (equivalente a un libro de 400 páginas). La estructura se presenta como un híbrido que integra funcionalidades de chat, inferencia y programación.
El investigador de inteligencia artificial Andrew Christianson afirmó en la plataforma de redes sociales X: "DeepSeek V3.1 logró un 71,6 % en Aider, aproximadamente un 1 % más que Claude Opus 4, y a un costo significativamente menor".
Según los cálculos, el coste medio para completar una tarea de programación utilizando V3.1 es de alrededor de 1,01 dólares, mientras que sistemas comparables pueden costar casi 70 dólares.
Algunos desarrolladores de la comunidad también han notado la presencia de cuatro “tokens especiales” en la arquitectura, lo que permite que el modelo integre la búsqueda web en tiempo real y gestione procesos de inferencia complejos.
Esta diferencia se traduce en millones de dólares en ahorros para las empresas que gestionan miles de interacciones de IA cada día.
Ventaja que cambia el juego
El lanzamiento de la versión 3.1 coincidió con el anuncio de nuevos modelos por parte de OpenAI y Anthropic. Al optar por un enfoque de código abierto, DeepSeek adoptó una estrategia diferente a la de muchas empresas estadounidenses que comercializan modelos de IA mediante API de pago.
Algunos sostienen que la amplia disponibilidad de capacidades avanzadas puede facilitar una implementación más rápida por parte de organizaciones y empresas, aunque también plantea un desafío a los modelos de negocios basados en monopolios tecnológicos.
La aparición de DeepSeek V3.1 demuestra que la IA avanzada no es sólo para grandes corporaciones, sino que grupos de investigación más pequeños también pueden participar.
La competencia en este campo ya no se limita a construir el sistema más potente, sino que también gira en torno a la capacidad de hacer que la tecnología sea accesible y asequible.
En este contexto, la pregunta para las empresas tecnológicas es cómo mantener el valor comercial cuando surgen cada vez más modelos de código abierto con rendimiento y costos competitivos.
Fuente: https://dantri.com.vn/cong-nghe/deepseek-am-tham-ra-phien-ban-ai-moi-20250820121017977.htm







Kommentar (0)