DeepSeek a révélé aujourd'hui des données sur les coûts et les revenus liés aux modèles populaires V3 et R1, affirmant des ratios coûts/bénéfices théoriques allant jusqu'à 545 % par jour, tout en avertissant que les revenus réels pourraient être inférieurs.
C’est la première fois que cette start-up chinoise spécialisée dans l’IA divulgue des informations sur les marges bénéficiaires des tâches d’« inférence » moins gourmandes en ressources de calcul, la phase post-entraînement impliquant des modèles d’IA entraînés effectuant des prédictions ou des tâches, par exemple via des chatbots.
Selon le ratio profit/coût théorique de DeepSeek, il atteint un incroyable 545 %.
Cette révélation de la société basée à Hangzhou pourrait encore davantage ébranler les marchés boursiers de l'IA en dehors de la Chine, qui ont chuté en janvier après que les chatbots Web et d'applications alimentés par les modèles R1 et V3 de la société ont connu une forte augmentation de popularité dans le monde entier .
La chute des cours des actions liées à l'IA était en partie due à l'annonce de DeepSeek selon laquelle l'entreprise avait dépensé moins de 6 millions de dollars pour les puces utilisées pour entraîner ses modèles, soit nettement moins que ses concurrents américains comme OpenAI.
Les puces que DeepSeek affirme avoir utilisées, les H800 de Nvidia, sont également nettement moins performantes que celles auxquelles OpenAI et d'autres sociétés américaines spécialisées dans l'IA ont accès, alimentant encore davantage le scepticisme des investisseurs quant à l'engagement des sociétés américaines d'IA à dépenser des milliards de dollars dans des puces de pointe.
DeepSeek a indiqué samedi, dans un message publié sur GitHub, qu'en supposant un coût de location de 2 $ par heure pour une puce H800, le coût total journalier d'inférence pour leurs modèles V3 et R1 s'élève à 87 072 $. En revanche, le revenu journalier théorique généré par ces modèles est de 562 027 $, soit un ratio profit/coût de 545 %. Sur une année, cela représenterait un chiffre d'affaires de plus de 200 millions de dollars.
Cependant, la société a ajouté que « les revenus réels sont nettement inférieurs » car le coût d'utilisation de son modèle V3 est inférieur à celui du modèle R1, seuls certains services sont monétisés car l'accès au Web et à l'application reste gratuit, et les développeurs paient moins pendant les heures creuses.
D'après le Wall Street Journal, les autorités chinoises ont demandé aux principaux chercheurs et entrepreneurs du secteur de l'intelligence artificielle (IA) d'éviter tout voyage d'affaires aux États-Unis. Le journal indique que les autorités chinoises craignent que les experts en IA se rendant à l'étranger ne divulguent des informations confidentielles sur le développement technologique du pays.
Par ailleurs, les autorités chinoises craignent que des dirigeants en voyage d'affaires ne soient arrêtés et utilisés comme monnaie d'échange dans les négociations entre les États-Unis et la Chine, rappelant l'arrestation d'une dirigeante de Huawei au Canada à la demande de Washington durant le premier mandat du président américain Donald Trump.
Selon cette source, les dirigeants des entreprises chinoises spécialisées dans l'IA doivent déclarer leurs voyages d'affaires aux autorités avant leur départ et à leur retour, en fournissant des comptes rendus détaillés de leurs activités et des personnes rencontrées.
Source : https://www.baogiaothong.vn/deepseek-tiet-lo-loi-nhuan-khung-tu-cac-mo-hinh-ai-192250301220905413.htm









Comment (0)