Nvidia califica el modelo R1 de DeepSeek como un "brillante avance en inteligencia artificial", a pesar de que el surgimiento de la startup ha "destruido" 600 mil millones de dólares de la capitalización de mercado del fabricante de chips.
En respuesta a CNBC , un portavoz de Nvidia calificó el modelo R1 de DeepSeek como "un avance notable en inteligencia artificial". El trabajo de DeepSeek muestra cómo se pueden crear nuevos modelos utilizando técnicas de escalamiento de tiempo de prueba. En la técnica de escala de tiempo de prueba propuesta por Nvidia, un modelo de IA completamente entrenado proporcionará mejores respuestas cuando dedique más tiempo a "razonar" mientras hace predicciones o genera imágenes o texto.
Los comentarios de Nvidia llegan después de que DeepSeek lanzara R1, un modelo de inferencia de código abierto que ha demostrado superar a los mejores modelos estadounidenses. El costo de entrenar a R1, según DeepSeek, fue menos de 6 millones de dólares, una fracción de los miles de millones de dólares que Silicon Valley gasta desarrollando sus modelos de IA.
El "shock" de DeepSeek hizo caer las acciones tecnológicas en todo el mundo . El 27 de enero, las acciones de Nvidia cayeron un 17% en valor, lo que equivale a que 600 mil millones de dólares de capitalización de mercado se desvanecieran, la mayor pérdida en la historia corporativa de Estados Unidos.
Otro gran nombre en el mundo de la IA, Yann LeCun, científico jefe de IA en Meta, también elogió a DeepSeek. Dijo que esto demuestra que “los modelos de código abierto están superando a los modelos propietarios”. “Proponen nuevas ideas y se basan en el trabajo de otros. Como su trabajo es público y de código abierto, todos pueden beneficiarse de él. Ese es el poder de la investigación abierta y el código abierto”, escribió en Threads.
La declaración de Nvidia se puede entender en el sentido de que el avance de DeepSeek está creando más puestos de trabajo para las unidades de procesamiento gráfico (GPU) de la compañía. La inferencia requiere una gran cantidad de GPU, explicó un portavoz de Nvidia. Además, esta persona afirmó que las GPU utilizadas por DeepSeek cumplen totalmente con las regulaciones de control de exportaciones de Estados Unidos.
Los analistas se preguntan si miles de millones de dólares invertidos por empresas como Microsoft, Google y Meta en infraestructura de IA se están desperdiciando cuando se pueden lograr resultados similares a un costo menor.
A principios de enero, Microsoft dijo que gastaría 80 mil millones de dólares solo en infraestructura de IA para 2025, mientras que el CEO de Meta, Mark Zuckerberg, dijo recientemente que planea invertir entre 60 mil millones y 65 mil millones de dólares en gastos de capital este año como parte de una estrategia de IA más amplia. El propio Zuckerberg es un defensor de los modelos de código abierto.
En septiembre de 2024, dijo que el objetivo en los próximos 10 a 15 años es crear una nueva generación de plataformas abiertas y ayudar a que las plataformas abiertas “ganen”, lo que conducirá a una industria tecnológica más dinámica.
(Según Insider, CNBC)
[anuncio_2]
Fuente: https://vietnamnet.vn/mat-600-ty-usd-vi-deepseek-nvidia-van-khen-ngoi-startup-trung-quoc-2367132.html
Kommentar (0)