DeepSeek a été détrôné.

Qwen3, une nouvelle technologie lancée par Alibaba. Photo : SCMP .

Selon les derniers tests de référence en IA, le modèle d'intelligence artificielle Qwen3 récemment publié par Alibaba a surpassé le R1 de DeepSeek pour devenir le modèle open-source le mieux noté au monde .

Plus précisément, les données de LiveBench, une plateforme indépendante qui évalue les grands modèles de langage (LLM), la technologie fondamentale des services d'IA générative comme ChatGPT, montrent que Qwen3 a surpassé R1 dans les tests.

L'évaluation des capacités des modèles d'IA open source comprend la programmation, les mathématiques, l'analyse de données et l'enseignement des langues.

Alibaba a lancé sa série de modèles d'IA Qwen3 le 28 avril. L'entreprise affirme que ce chatbot peut rivaliser, voire surpasser dans certains cas, les meilleurs modèles actuels d'OpenAI ou de Google.

Avec jusqu'à 235 milliards de paramètres, Qwen3 offre des performances comparables à DeepSeek-V2 et OpenAI GPT-4, qui comptent respectivement environ 236 milliards et 175 milliards de paramètres. Les utilisateurs pourront bientôt le télécharger sous licence libre sur la plateforme de développement d'IA Hugging Face et sur GitHub dès la publication de cette série de modèles.

L'entreprise a indiqué que la collection Qwen3 comprend des modèles hybrides, capables de répartir le temps de raisonnement de manière flexible afin de résoudre des problèmes complexes ou de répondre rapidement à des requêtes simples. Dans ce modèle, la capacité de raisonnement permet une auto-vérification de l'exactitude des informations, mais cela induit un délai important.

Cette conception permet aux utilisateurs d'allouer facilement un budget adapté à chaque tâche. De plus, ce modèle s'inspire des pratiques de nombreux concurrents à travers le monde.

Grâce à une architecture de type « mélange d'experts » (MoE) similaire à celle de DeepSeek, Qwen3 optimise les performances de calcul tout en réduisant considérablement le coût d'entraînement. Cette méthode décompose les tâches en de nombreuses parties distinctes et ne requiert qu'une quantité suffisante de données, même à forte intensité de données, pour les exécuter.

Selon l'équipe de développement, Qwen3 prend en charge jusqu'à 119 langues et a été entraîné sur un ensemble de données de près de 36 000 milliards de jetons, soit l'équivalent de 27 000 milliards de mots. Les données d'entraînement proviennent de diverses sources telles que des manuels scolaires, des ensembles de questions-réponses, du code de programmation, ou encore des données générées par l'IA.

Malgré sa première place dans le classement des logiciels libres, le test de performance approfondi de LiveBench montre que Qwen3 reste en deçà des principaux modèles d'IA propriétaires au monde. Parmi ceux-ci, les plus connus sont o3 d'OpenAI, Gemini Pro 2.5 de Google et Claude 3.7 d'Anthropic.

Actuellement, le modèle OpenAI le plus avancé pris en charge par Microsoft, o3-mini high, domine le classement général des modèles d'IA dans le monde.