Este nuevo modelo no solo desafía el dominio de los gigantes estadounidenses, sino que también transforma por completo el juego con código abierto (Imagen ilustrativa: DS).
Este modelo cuenta con 685 mil millones de parámetros y se distribuye bajo una licencia de código abierto. Los resultados de las pruebas iniciales muestran un rendimiento comparable al de sistemas propietarios de OpenAI o Anthropic, y abre nuevas vías para el desarrollo y la distribución de modelos avanzados de IA.
Rendimiento y coste
Inmediatamente después de su lanzamiento en la plataforma Hugging Face, DeepSeek V3.1 obtuvo una puntuación del 71,6 % en la prueba de programación Aider. Técnicamente, el modelo es capaz de manejar contexto con hasta 128 000 tokens (equivalente a un libro de 400 páginas). Su estructura se presenta como un modelo híbrido que integra funcionalidades de chat, inferencia y programación.
El investigador de IA Andrew Christianson afirmó en la plataforma de redes sociales X: "DeepSeek V3.1 logró un 71,6% en Aider, aproximadamente un 1% más que Claude Opus 4, a un costo significativamente menor".
Según los cálculos, el coste medio para completar una tarea de programación utilizando la versión 3.1 ronda los 1,01 dólares, mientras que los sistemas comparables pueden costar casi 70 dólares.
Algunos desarrolladores de la comunidad también han señalado la presencia de cuatro "tokens especiales" en la arquitectura, que permiten al modelo integrar la búsqueda web en tiempo real y gestionar procesos de inferencia complejos.
Esta diferencia se traduce en millones de dólares de ahorro para las empresas que gestionan miles de interacciones con IA cada día.
Una ventaja que cambia el rumbo del juego
El lanzamiento de la versión 3.1 coincidió con el anuncio de nuevos modelos por parte de OpenAI y Anthropic. Al optar por un enfoque de código abierto, DeepSeek siguió una estrategia diferente a la de muchas empresas estadounidenses que comercializan modelos de IA mediante API de pago.
Algunos argumentan que la amplia disponibilidad de capacidades avanzadas puede facilitar una implementación más rápida por parte de las organizaciones y las empresas, al tiempo que supone un desafío para los modelos de negocio basados en monopolios tecnológicos.
La aparición de DeepSeek V3.1 demuestra que la IA avanzada no es solo para grandes corporaciones, sino que también pueden participar grupos de investigación más pequeños.
La competencia en este campo ya no se limita a construir el sistema más potente, sino que también gira en torno a la capacidad de hacer que la tecnología sea accesible y asequible.
En este contexto, la pregunta para las empresas tecnológicas es cómo mantener el valor comercial cuando cada vez surgen más modelos de código abierto con un rendimiento y un coste competitivos.
Fuente: https://dantri.com.vn/cong-nghe/deepseek-am-tham-ra-phien-ban-ai-moi-20250820121017977.htm






Kommentar (0)