Nvidia qualifie le modèle R1 de DeepSeek de « brillante avancée en matière d'IA », malgré l'émergence de la startup qui a « fait exploser » 600 milliards de dollars de la capitalisation boursière du fabricant de puces.
En réponse à CNBC , un porte-parole de Nvidia a qualifié le modèle R1 de DeepSeek de « remarquable avancée en matière d'IA ». Le travail de DeepSeek montre comment de nouveaux modèles peuvent être créés à l’aide de techniques de mise à l’échelle du temps de test. Dans la technique de mise à l'échelle du temps de test proposée par Nvidia, un modèle d'IA entièrement formé fournira de meilleures réponses lorsqu'il passera plus de temps à « raisonner » tout en faisant des prédictions ou en générant des images ou du texte.
Les commentaires de Nvidia interviennent après que DeepSeek a publié R1, un modèle d'inférence open source qui s'est avéré plus performant que les meilleurs modèles américains. Selon DeepSeek, le coût de formation de R1 était inférieur à 6 millions de dollars, soit une fraction des milliards de dollars que la Silicon Valley dépense pour développer ses modèles d'IA.
Le « choc » de DeepSeek a fait s'effondrer les actions technologiques dans le monde entier. Le 27 janvier, les actions Nvidia ont chuté de 17%, ce qui équivaut à une perte de 600 milliards de dollars de capitalisation boursière, la plus grande perte de l'histoire des entreprises américaines.
Un autre grand nom du monde de l’IA – Yann LeCun, scientifique en chef de l’IA chez Meta – a également fait l’éloge de DeepSeek. Il a déclaré que cela démontrait que « les modèles open source surpassent les modèles propriétaires ». « Ils proposent de nouvelles idées et s'appuient sur le travail des autres. Leur travail étant public et open source, chacun peut en bénéficier. C'est là toute la puissance de la recherche ouverte et de l'open source », a-t-il écrit sur Threads.
La déclaration de Nvidia peut être comprise dans le sens où la percée de DeepSeek crée davantage d'emplois pour les unités de traitement graphique (GPU) de l'entreprise. L'inférence nécessite un nombre énorme de GPU, a expliqué un porte-parole de Nvidia. De plus, cette personne a affirmé que les GPU utilisés par DeepSeek sont entièrement conformes aux réglementations américaines en matière de contrôle des exportations.
Les analystes se demandent si les milliards de dollars investis par des entreprises comme Microsoft, Google et Meta dans l’infrastructure de l’IA ne sont pas gaspillés alors que des résultats similaires peuvent être obtenus à moindre coût.
Début janvier, Microsoft a déclaré qu'il dépenserait 80 milliards de dollars dans la seule infrastructure d'IA d'ici 2025, tandis que le PDG de Meta, Mark Zuckerberg, a récemment déclaré qu'il prévoyait d'investir 60 à 65 milliards de dollars en dépenses d'investissement cette année dans le cadre d'une stratégie d'IA plus large. Zuckerberg lui-même est un partisan des modèles open source.
En septembre 2024, il a déclaré que l'objectif pour les 10 à 15 prochaines années était de créer une nouvelle génération de plateformes ouvertes et d'aider les plateformes ouvertes à « gagner », conduisant à une industrie technologique plus dynamique.
(Selon Insider, CNBC)
Source : https://vietnamnet.vn/mat-600-ty-usd-vi-deepseek-nvidia-van-khen-ngoi-startup-trung-quoc-2367132.html
Comment (0)