DeepSeek a révélé aujourd'hui des données sur les coûts et les revenus liés aux modèles populaires V3 et R1, affirmant un ratio coût-bénéfice théorique pouvant atteindre 545 % par jour, malgré les avertissements selon lesquels les revenus réels pourraient être inférieurs.
C’est la première fois que cette start-up chinoise spécialisée dans l’IA révèle des informations sur ses marges bénéficiaires issues de tâches d’« inférence » moins exigeantes en termes de calcul, c’est-à-dire la phase post-entraînement qui consiste pour les modèles d’IA entraînés à effectuer des prédictions ou des tâches, par exemple via des chatbots.
Le retour sur investissement théorique (ROI) revendiqué par DeepSeek est un chiffre impressionnant de 545 %.
Cette révélation de la société basée à Hangzhou pourrait encore davantage bouleverser le marché boursier de l'IA en dehors de la Chine, qui a chuté en janvier après que les chatbots web et applications alimentés par les modèles R1 et V3 de la société ont connu une popularité fulgurante dans le monde entier .
La chute des cours des actions liées à l'IA était en partie due aux affirmations selon lesquelles DeepSeek aurait dépensé moins de 6 millions de dollars pour les puces utilisées pour entraîner ses modèles, soit beaucoup moins que ses concurrents américains comme OpenAI.
Les puces que DeepSeek affirme avoir utilisées, les H800 de Nvidia, sont également beaucoup moins puissantes que celles auxquelles OpenAI et d'autres sociétés américaines spécialisées dans l'IA ont accès, ce qui rend les investisseurs encore plus sceptiques quant aux promesses de ces sociétés de dépenser des milliards dans des puces de pointe.
En supposant un coût de location de 2 $ par heure pour une puce H800, le coût total journalier d'inférence pour ses modèles V3 et R1 s'élève à 87 072 $, selon un article publié samedi sur GitHub par DeepSeek. En revanche, le revenu journalier théorique généré par ces modèles est de 562 027 $, soit un retour sur investissement de 545 %. Sur une année, cela représenterait plus de 200 millions de dollars de revenus.
Cependant, la société a ajouté que son « chiffre d'affaires réel est nettement inférieur » car le coût d'utilisation de son modèle V3 est inférieur à celui du modèle R1, seuls certains services sont monétisés car l'accès au Web et à l'application reste gratuit, et les développeurs paient moins pendant les heures creuses.
D'après le Wall Street Journal, les autorités chinoises ont ordonné aux plus éminents chercheurs et entrepreneurs du secteur de l'intelligence artificielle (IA) d'éviter tout voyage d'affaires aux États-Unis. Le journal précise que les autorités craignent que les experts en IA se rendant à l'étranger ne divulguent des informations confidentielles sur le développement technologique du pays.
Par ailleurs, les autorités chinoises craignent également que des dirigeants en voyage d'affaires puissent être détenus et utilisés comme monnaie d'échange dans les négociations entre les États-Unis et la Chine, rappelant l'arrestation d'une dirigeante de Huawei au Canada à la demande de Washington, survenue durant le premier mandat du président américain Donald Trump.
Selon cette source, les dirigeants des entreprises chinoises spécialisées dans l'IA, lorsqu'ils partent en voyage d'affaires, doivent déclarer leurs projets aux autorités avant leur départ et, à leur retour, fournir un compte rendu précis de leurs activités et des personnes rencontrées.
Source : https://www.baogiaothong.vn/deepseek-tiet-lo-loi-nhuan-khung-tu-cac-mo-hinh-ai-192250301220905413.htm







Comment (0)