Dans son rapport, DeepSeek indique que le coût total de la formation s'élève à 5,576 millions de dollars, principalement dû au coût de la location des processeurs graphiques Nvidia. L'entreprise précise également que ce chiffre ne reflète que la « formation formelle » et n'inclut pas les coûts liés aux recherches ou expérimentations antérieures sur l'architecture, les algorithmes et les données. Ce chiffre a immédiatement attiré les investisseurs et provoqué la perte de 1 000 milliards de dollars de valeur des actions technologiques mondiales en une seule journée, le 27 janvier.
Les coûts d’exploitation de DeepSeek sont-ils beaucoup plus élevés que ce qui est annoncé ?
Un rapport du cabinet de recherche et de conseil en semi-conducteurs SemiAnalysis propose une analyse différente des coûts de développement de DeepSeek. Le cabinet estime que les dépenses matérielles de DeepSeek sont bien supérieures aux prévisions, soulignant que la R&D et le coût total de possession étaient importants.
SemiAnalysis a déclaré que la génération de « données synthétiques » pour les modèles d'entraînement nécessiterait « une puissance de calcul considérable ». De plus, les entreprises devraient expérimenter, développer de nouvelles architectures, collecter et nettoyer les données, et rémunérer leurs employés.
DeepSeek a besoin de 50 000 GPU au lieu d'un peu plus de 2 000 GPU ?
Selon les calculs, les experts affirment que DeepSeek exploite un système informatique à grande échelle composé d'environ 50 000 GPU Hopper, de 10 000 GPU H800 et de 10 000 GPU H100 plus puissants, ainsi que de GPU H20 supplémentaires. Ce chiffre contredit les précédentes déclarations de DeepSeek, qui affirmait n'utiliser que 2 048 GPU Nvidia. Le total des investissements pour le serveur est estimé à environ 1,6 milliard de dollars, tandis que les coûts d'exploitation s'élèvent à 944 millions de dollars.
SemiAnalysis estime que 50 000 GPU Nvidia ont été utilisés par DeepSeek
DeepSeek a été fondée en 2023 par Liang Wenfeng, cofondateur de High-Flyer, un fonds spéculatif chinois spécialisé dans l'IA. La startup est née de l'unité de recherche en IA du fonds en avril 2023, avec pour objectif de développer de grands modèles linguistiques et de parvenir à l'intelligence artificielle générale (IAG).
L'intérêt pour DeepSeek a augmenté avec le lancement de R1, un modèle de raisonnement concurrent d'o1 d'OpenAI, mais open source, permettant à tout développeur d'IA de l'utiliser. Cependant, comme beaucoup d'autres chatbots chinois, DeepSeek présente des limitations sur certains sujets.
Sam Altman, PDG d'OpenAI, a salué le modèle de DeepSeek, soulignant qu'il s'agissait « clairement d'un excellent modèle ». Cependant, il a également affirmé qu'il existait des preuves que DeepSeek avait collecté les données d'OpenAI pour fonctionner de manière « distillée ».
Source : https://thanhnien.vn/chi-phi-phat-trien-deepseek-bi-tang-boc-185250203151508438.htm
Comment (0)