Vietnam.vn - Nền tảng quảng bá Việt Nam

DeepSeek détrôné

Le modèle d'IA d'Alibaba, appelé Qwen3, a dépassé R1 dans les tests LiveBench qui évaluent les capacités des modèles open source, notamment la programmation, les mathématiques et l'analyse de données.

ZNewsZNews06/05/2025

Qwen3, une nouvelle technologie lancée par Alibaba. Photo : SCMP .

Selon les derniers tests de référence du monde de l'IA, le nouveau modèle d'intelligence artificielle Qwen3 d'Alibaba a dépassé le R1 de DeepSeek pour devenir le modèle open source le mieux classé au monde .

Plus précisément, les données de LiveBench, une plateforme indépendante qui évalue les grands modèles de langage (LLM), la technologie sous-jacente des services d'IA génératifs comme ChatGPT, montrent que Qwen3 a surpassé R1 dans ses tests.

L’étude évalue les capacités des modèles d’IA open source, notamment la programmation, les mathématiques, l’analyse de données et l’enseignement des langues.

La série de modèles d'IA appelée Qwen3 a été lancée par Alibaba le 28 avril. La société affirme que ce chatbot peut être comparable, voire surpasser, les meilleurs modèles actuellement disponibles chez OpenAI ou Google dans certains cas.

Avec une taille pouvant atteindre 235 milliards de paramètres, Qwen3 est comparable à DeepSeek-V2 et OpenAI GPT-4, qui en comptent respectivement environ 236 et 175 milliards. Les utilisateurs pourront bientôt le télécharger sous licence libre sur la plateforme de développement d'IA Hugging Face et GitHub une fois la série de modèles publiée.

L'entreprise affirme que la collection Qwen3 comprend des modèles hybrides, ce qui signifie qu'ils peuvent raisonner de manière flexible pour résoudre des problèmes complexes ou répondre rapidement à des demandes simples. Dans ce cas, la capacité de raisonnement permet au modèle de vérifier lui-même l'exactitude des informations, mais au prix d'une latence élevée.

Cette conception permet aux utilisateurs d'allouer facilement le budget approprié à chaque tâche spécifique. De plus, ce modèle s'inspire de nombreux concurrents à travers le monde.

Grâce à une architecture de « mélange d'experts » (MoE) similaire à DeepSeek, Qwen3 peut maximiser l'efficacité de calcul à un coût de formation bien inférieur. Cette méthode permet de décomposer une tâche en plusieurs parties et de recommander uniquement la quantité de données approfondies nécessaire à son exécution.

Selon l'équipe de développement, Qwen3 prend en charge jusqu'à 119 langues et s'appuie sur un ensemble de données de près de 36 000 milliards de jetons, soit l'équivalent de 27 000 milliards de mots. Les données d'entraînement proviennent de nombreuses sources, telles que des manuels scolaires, des questionnaires, du code de programmation ou des IA auto-générées.

Bien qu'il soit en tête du classement open source, des tests approfondis effectués par LiveBench montrent que Qwen3 est toujours à la traîne par rapport aux principaux modèles d'IA à source fermée du monde, notamment o3 d'OpenAI, Gemini Pro 2.5 de Google et Claude 3.7 d'Anthropic.

Actuellement, le modèle haut de gamme d'OpenAI soutenu par Microsoft, o3-mini high, est en tête du classement général des modèles d'IA dans le monde.

Source : https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html


Comment (0)

No data
No data

Patrimoine

Chiffre

Entreprise

No videos available

Nouvelles

Système politique

Locale

Produit