Qwen3, une nouvelle technologie lancée par Alibaba. Photo : SCMP . |
Selon les derniers tests de référence du monde de l'IA, le modèle d'intelligence artificielle Qwen3, récemment publié par Alibaba, a surpassé R1 de DeepSeek pour devenir le modèle open-source le mieux classé au monde .
Plus précisément, les données de LiveBench, une plateforme indépendante qui évalue les grands modèles de langage (LLM), la technologie qui sous-tend les services d'IA générative comme ChatGPT, montrent que Qwen3 a surpassé R1 lors des tests.
L'évaluation des capacités des modèles d'IA open source comprend la programmation, les mathématiques, l'analyse de données et l'enseignement des langues.
La série de modèles d'IA appelée Qwen3 a été lancée par Alibaba le 28 avril. L'entreprise affirme que ce chatbot peut être comparable, voire surpasser dans certains cas, les meilleurs modèles actuellement disponibles chez OpenAI ou Google.
Avec jusqu'à 235 milliards de paramètres, Qwen3 rivalise avec DeepSeek-V2 et OpenAI GPT-4, qui comptent respectivement environ 236 milliards et 175 milliards de paramètres. Les utilisateurs pourront bientôt le télécharger sous licence libre sur la plateforme de développement d'IA Hugging Face et sur GitHub, une fois la série de modèles publiée.
L'entreprise indique que la collection Qwen3 comprend des modèles hybrides, capables d'adapter leur temps d'inférence pour résoudre des problèmes complexes ou répondre rapidement à des requêtes simples. Dans ce cas, l'inférence permet au modèle de vérifier l'exactitude des informations, mais induit une latence élevée.
Cette conception permet aux utilisateurs d'allouer facilement le budget approprié à chaque tâche. De plus, ce modèle s'inspire des pratiques de nombreux concurrents à travers le monde.
Grâce à une architecture de type « mixte d'experts » (MoE) similaire à celle de DeepSeek, Qwen3 optimise l'efficacité de calcul tout en réduisant considérablement le coût de l'entraînement. Cette approche consiste à décomposer une tâche en sous-tâches et à ne recommander que les données d'apprentissage profond nécessaires à son exécution.
Selon l'équipe de développement, Qwen3 prend en charge jusqu'à 119 langues et est entraîné sur un ensemble de données de près de 36 000 milliards de jetons, soit l'équivalent de 27 000 milliards de mots. Les données d'entraînement proviennent de nombreuses sources telles que des manuels scolaires, des ensembles de questions-réponses, du code de programmation ou des IA auto-générées…
Malgré sa première place dans les classements open-source, des tests approfondis menés par LiveBench montrent que Qwen3 est à la traîne par rapport aux principaux modèles d'IA propriétaires au monde, notamment o3 d'OpenAI, Gemini Pro 2.5 de Google et Claude 3.7 d'Anthropic.
Actuellement, le modèle haut de gamme d'OpenAI, soutenu par Microsoft, o3-mini high, occupe la première place du classement général des modèles d'IA au monde.
Source : https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html










Comment (0)