![]() |
DeepSeek a choisi de miser sur des prix bas pour rester compétitif. Photo : Bloomberg . |
Début 2025, le lancement de DeepSeek R1 a fait perdre à Nvidia 600 milliards de dollars de capitalisation boursière en une seule journée. À l'époque, ce nouveau modèle chinois a secoué le monde de la tech. Un an plus tard, DeepSeek V4 est sorti, mais sans parvenir à rencontrer le même succès.
DeepSeek n'est plus un mystère. Le modèle V4 repose sur l'architecture MoE avec 1 600 milliards de paramètres, mais chaque inférence n'en déclenche que 49 milliards. Ce mécanisme d'« appel à la demande » réduit considérablement les coûts d'inférence sans impacter les performances. La fenêtre de contexte atteint un million de jetons, permettant aux utilisateurs d'intégrer des lignes de commande complètes ou des rapports de plusieurs centaines de milliers de mots dans une seule conversation.
DeepSeek reconnaît que le V4 accuse un retard de 3 à 6 mois par rapport aux modèles en boucle fermée. Cependant, lorsque le cluster de calcul équipé de la puce Huawei Ascend 950 sera opérationnel plus tard cette année, le prix du V4 chutera fortement.
« Il s'agit d'une déclaration d'une entreprise qui a déjà planifié sa prochaine action, et non d'une entreprise qui réagit sous la pression », a commenté un analyste du secteur.
Le problème avec le V4 ne réside pas dans ses performances exceptionnelles. Il est simplement suffisant pour constituer la norme minimale du secteur. Une analyse d'Union Bancaire Privée suggère que l'écart de performances entre les modèles haut de gamme sera quasiment imperceptible pour la grande majorité des utilisateurs.
Lorsque tous les aspects sont satisfaisants, la bataille se déplace vers le prix, l'écosystème et la question de savoir qui deviendra le choix par défaut dans le flux de travail des développeurs à l'échelle mondiale. DeepSeek l'a parfaitement compris. Sa stratégie open source lui permet d'attirer des dizaines de milliers de développeurs du monde entier pour créer des applications sur sa plateforme, sans avoir à supporter les coûts liés au marketing ou à une équipe commerciale.
DeepSeek n'a pas encore bénéficié d'investissements externes. Tencent et Alibaba, deux entreprises ayant développé leurs propres modèles d'IA, semblent se disputer une place au sein du premier tour de table de DeepSeek. En effet, la stratégie de DeepSeek, axée sur une efficacité maximale et l'open source, a le potentiel de façonner la norme mondiale en matière d'infrastructure d'IA.
Source : https://znews.vn/deepseek-hut-hoi-post1646660.html







Comment (0)