DeepSeek está dando un impulso sin precedentes a los esfuerzos de China por reducir su dependencia del ecosistema Nvidia.
Durante años, los desarrolladores de chips chinos han admirado a Nvidia ya que el gigante estadounidense estableció una posición inigualable en la industria gracias a sus capacidades de hardware y al kit de herramientas CUDA propietario que los ingenieros utilizan para desarrollar aplicaciones en las unidades de procesamiento gráfico (GPU) de la compañía.
Aún así, con el lanzamiento de DeepSeek V3 y R1, están ganando más impulso para alejarse de la órbita de Nvidia.
Infinigence AI, un proveedor de plataformas de infraestructura informática, dijo que está trabajando con siete desarrolladores de chips chinos líderes: Biren Technology, Hygon Information Technology, Moore Threads, MetaX, Enflame, Iluvatar CoreX y Ascend.
Durante una visita a China en enero, el director ejecutivo de Nvidia, Jensen Huang, afirmó que cerca de 1,5 millones de desarrolladores en el país utilizaban CUDA. La compañía también se asoció con más de 3.000 startups para impulsar el desarrollo de la industria tecnológica en el país.
Exactamente cuántos chips utilizó DeepSeek para entrenar sus modelos V3 y R1 sigue siendo un misterio, pero se ha especulado que los chips Huawei jugaron un papel clave en el éxito de la startup.
Según Tom's Hardware, los modelos que funcionan con el Huawei Ascend 910C pueden alcanzar el 60 % del rendimiento de inferencia del Nvidia H100. Es probable que la dependencia del ecosistema de software de Nvidia disminuya a medida que la inferencia de IA adquiera mayor importancia en el futuro.
Mientras tanto, los fabricantes de chips chinos están intensificando sus esfuerzos para integrar DeepSeek y reducir su dependencia de los chips estadounidenses. Un informe de la Televisión Central de China (CCTV) mostró que al menos 15 fabricantes de chips nacionales han adaptado sus productos para integrar mejor el entrenamiento y las operaciones de DeepSeek, lo que permite ejecutar los modelos de DeepSeek en infraestructuras informáticas nacionales.
Kunlun Xin, la empresa de chips de inteligencia artificial de Baidu, tardó menos de una semana en adaptar su hardware al modelo de código abierto de DeepSeek, significativamente más rápido que los modelos de código abierto, según el director ejecutivo Ouyang Jian.
La semana pasada, la compañía dijo que comenzó a brindar soporte para los modelos DeepSeek V3 y R1, lo que permitirá a los desarrolladores implementar aplicaciones rápidamente a bajo costo.
Los modelos de IA de DeepSeek se consideran una muestra de la resiliencia de China ante las medidas represivas de EE. UU. Algunas de las predicciones innovadoras de la startup impulsarán el desarrollo de la IA en diversas industrias nacionales.
El diseñador de chips Loongson Technology ha respaldado el modelo DeepSeek para que los usuarios puedan ejecutarlo en sus computadoras. La división de computación en la nube de Huawei también se ha asociado con la startup de infraestructura de IA SiliconFlow para ofrecer los modelos DeepSeek V3 y R1 en su servicio en la nube Ascend. Huawei afirma que el rendimiento es comparable al de ejecutar el modelo en GPU de alta gama.
(Según SCMP)
[anuncio_2]
Fuente: https://vietnamnet.vn/deepseek-tao-dong-luc-de-trung-quoc-giam-le-thuoc-nvidia-2370958.html
Kommentar (0)