Investigadores de DeepSeek han publicado un nuevo modelo experimental llamado V3.2-exp, diseñado para reducir significativamente los costes de inferencia cuando se utiliza en operaciones con contexto extenso.
DeepSeek publicó este modelo en una entrada de Hugging Face y también publicó un artículo académico vinculado en GitHub.
La característica más importante de este nuevo y sofisticado modelo se denomina DeepSeek Sparse Attention. Básicamente, el sistema utiliza un módulo llamado "indexador relámpago" para priorizar fragmentos específicos de la ventana de contexto.

DeepSeek anuncia un modelo de inferencia rentable.
Luego, un sistema independiente llamado "sistema de selección de tokens de atención dispersa" selecciona tokens específicos de esos fragmentos para cargarlos en la ventana de atención limitada del módulo. En conjunto, estos sistemas permiten que los modelos de atención dispersa operen en secciones de contexto extensas con una carga de servidor relativamente baja.
Para operaciones con contexto prolongado, las ventajas del sistema son significativas. Las pruebas preliminares de DeepSeek demuestran que el coste de una llamada a una función de inferencia simple (API) puede reducirse hasta en un 50 % en escenarios con contexto prolongado.
Se necesitan más pruebas para elaborar una evaluación más sólida, pero dado que este modelo es de código abierto y está disponible gratuitamente en Hugging Face, no debería pasar mucho tiempo antes de que evaluadores externos puedan valorar las afirmaciones del documento.

A diferencia de otros modelos de chatbots de IA que consumen enormes cantidades de energía, DeepSeek se centra en ahorrar en costes de entrenamiento y operación.
El nuevo modelo de DeepSeek es uno de una serie de avances recientes que abordan el problema del coste de inferencia; esencialmente, el coste de los servidores que ejecutan un modelo de IA preentrenado, en contraposición al coste de entrenarlo.
En el caso de DeepSeek, los investigadores buscaban hacer más eficiente la arquitectura subyacente del transformador, y descubrieron que se necesitaban mejoras significativas.
Con sede en China, DeepSeek es un actor atípico en el auge de la IA, especialmente para quienes ven la investigación en IA como una competencia entre Estados Unidos y China. La compañía causó sensación a principios de este año con su modelo R1, que se entrena principalmente mediante aprendizaje por refuerzo a un costo mucho menor que el de sus competidores estadounidenses.
Sin embargo, este modelo no generó una revolución completa en el entrenamiento de la IA, como algunos habían predicho, y la empresa fue desapareciendo gradualmente del foco de atención en los meses siguientes.
Es improbable que el nuevo enfoque de "atención dispersa" cause la misma indignación que R1, pero aún así podría enseñar a los proveedores de servicios estadounidenses algunos consejos muy necesarios para ayudar a mantener bajos los costos de inferencia.
https://techcrunch.com/2025/09/29/deepseek-releases-sparse-attention-model-that-cuts-api-costs-in-half/
Fuente: https://khoahocdoisong.vn/deepseek-dao-tao-da-re-nay-con-co-ban-suy-luan-re-hon-post2149057353.html
Kommentar (0)