DeepSeek a révélé aujourd'hui certaines données sur les coûts et les revenus liés aux modèles populaires V3 et R1, affirmant un ratio coût/bénéfice théorique allant jusqu'à 545 % par jour, malgré les avertissements selon lesquels les revenus réels pourraient être inférieurs.
C'est la première fois que la start-up chinoise d'IA révèle des informations sur ses marges bénéficiaires issues de tâches « d'inférence » moins exigeantes en termes de calcul, l'étape post-formation qui implique que des modèles d'IA formés effectuent des prédictions ou exécutent des tâches, par exemple via des chatbots.
Le retour sur investissement théorique (ROI) revendiqué par DeepSeek est de 545 %.
La révélation de la société basée à Hangzhou pourrait encore bouleverser le marché boursier de l'IA en dehors de la Chine, qui a plongé en janvier après que les chatbots Web et d'applications alimentés par les modèles R1 et V3 de la société ont gagné en popularité dans le monde entier .
La chute des actions d'IA est en partie due aux allégations selon lesquelles DeepSeek aurait dépensé moins de 6 millions de dollars en puces utilisées pour former ses modèles, bien moins que ce que dépensent ses concurrents américains comme OpenAI.
Les puces que DeepSeek prétend avoir utilisées, les H800 de Nvidia, sont également beaucoup moins puissantes que celles auxquelles OpenAI et d'autres sociétés d'IA américaines ont accès, ce qui rend les investisseurs encore plus sceptiques quant aux promesses des sociétés d'IA américaines de dépenser des milliards pour des puces de pointe.
En supposant que le coût de location d'une puce H800 soit de 2 $ par heure, le coût total d'inférence quotidien pour ses modèles V3 et R1 s'élève à 87 072 $, a indiqué DeepSeek dans un article GitHub publié samedi. En comparaison, le revenu quotidien théorique généré par ces modèles est de 562 027 $, soit un retour sur investissement de 545 %. Sur un an, cela représenterait un chiffre d'affaires de plus de 200 millions de dollars.
Cependant, la société a ajouté que ses « revenus réels sont nettement inférieurs » car le coût d'utilisation de son modèle V3 est inférieur à celui du modèle R1, seuls certains services sont monétisés car l'accès au Web et aux applications reste gratuit et les développeurs paient moins pendant les heures creuses.
Les autorités chinoises ont ordonné aux meilleurs chercheurs et entrepreneurs en intelligence artificielle (IA) du pays d'éviter tout voyage d'affaires aux États-Unis, rapporte le Wall Street Journal. Le journal précise que les autorités chinoises craignent que les experts en IA en déplacement à l'étranger ne révèlent des informations confidentielles sur le développement technologique du pays.
En outre, les autorités chinoises craignent également que des dirigeants en déplacement professionnel puissent être détenus et utilisés comme monnaie d'échange dans les négociations entre les États-Unis et la Chine, rappelant l'arrestation d'un dirigeant de Huawei au Canada à la demande de Washington qui a eu lieu pendant le premier mandat du président américain Donald Trump.
Selon cette source, les dirigeants des entreprises chinoises d'IA, s'ils partent en voyage d'affaires, doivent signaler leurs projets aux autorités avant de partir et, à leur retour, donner un compte rendu précis de ce qu'ils ont fait et des personnes qu'ils ont rencontrées.
Source : https://www.baogiaothong.vn/deepseek-tiet-lo-loi-nhuan-khung-tu-cac-mo-hinh-ai-192250301220905413.htm
Comment (0)