La nouvelle IA de DeepSeek continue de faire sensation dans le monde de la technologie grâce à ses performances exceptionnelles. Photo : SCMP . |
DeepSeek présente officiellement DeepSeek V3-0324, la dernière version de la famille V3 des langages de modélisation à grande échelle (LLM).
Comme ses prédécesseurs, ce modèle est distribué gratuitement et en open source via la plateforme Hugging Face, avec des améliorations significatives par rapport aux versions précédentes, notamment dans les domaines du raisonnement et de la programmation.
Plus précisément, selon OpenRouter, DeepSeek V3-0324 a été construit en utilisant Mixture of Experts (MoE), une méthode d'apprentissage automatique très populaire dans certains modèles d'IA chinois, et possède 685 milliards de paramètres.
D'après les premiers retours, ce modèle affiche des performances impressionnantes sur de nombreuses tâches. Par ailleurs, un message publié sur Reddit indique que DeepSeek V3-0324 a rattrapé le modèle Sonnet 3.7 de Google lors d'un test de génération de code.
D'autres sources indiquent que DeepSeek V3-0324 est capable de générer de longs extraits de code sans erreur. Le site web d'analyse d'IA Vidhya a testé ce modèle et a constaté sa capacité à générer sans problème 700 lignes de code.
Sur X, l'application DeepSeek V3-0324 a également fait sensation. Pour preuve, l'utilisateur Deepanshu Sharma a publié une vidéo montrant que ce modèle d'IA pouvait générer sans problème un site web complet avec plus de 800 lignes de code.
En décembre 2024, DeepSeek est devenue l'entreprise chinoise d'IA la plus en vue lors du lancement de DeepSeek-V3. Ce modèle a atteint des performances comparables à celles de GPT-40, mais en utilisant une fraction seulement des ressources de calcul.
Peu après, DeepSeek a publié son modèle de raisonnement DeepSeek-R1. Selon TechCrunch , R1 a surpassé o1 d'OpenAI sur des benchmarks tels que AIME, MATH-500 et SWE-bench Verified.
Parallèlement, le chiffre de 5,6 millions de dollars pour la formation finale du modèle de DeepSeek est également choquant, comparé aux centaines de millions de dollars que les principales entreprises américaines dépensent pour la formation de leurs modèles.
Source : https://znews.vn/at-chu-bai-moi-cua-deepseek-lo-dien-post1540831.html






Comment (0)