Vietnam.vn - Nền tảng quảng bá Việt Nam

Une série d'IA plus puissante en provenance de Chine

Le modèle peut rivaliser avec des concurrents puissants dans le monde entier, ce qui témoigne du potentiel technologique croissant du pays d’un milliard d’habitants.

Zing NewsZing News29/04/2025

Qwen3, nouvelle technologie lancée par Alibaba. Photo : Reuters .

Le 28 avril, le géant technologique chinois Alibaba a lancé une série de modèles d’IA appelés Qwen3. L'entreprise affirme que ce chatbot peut égaler, voire surpasser, les meilleurs modèles actuels d'OpenAI ou de Google dans certains cas.

Avec une taille allant jusqu'à 235 milliards de paramètres, Qwen3 a des performances comparables à celles de DeepSeek-V2 et OpenAI GPT-4, qui ont respectivement environ 236 milliards et 175 milliards de paramètres. Les utilisateurs pourront bientôt le télécharger sous licence ouverte sur la plateforme de développement Hugging Face AI et Github une fois cette série de modèles publiée.

L'entreprise affirme que la collection Qwen3 comprend des modèles hybrides, ce qui signifie qu'ils peuvent adapter leur temps pour résoudre des problèmes complexes ou répondre rapidement à des demandes simples. Dans ce cas, la capacité d’inférence aide le modèle à vérifier lui-même l’exactitude des informations, mais reçoit une latence élevée.

Cette conception permet aux utilisateurs d’allouer facilement le budget approprié à chaque tâche spécifique. De plus, ce modèle s’inspire également de nombreux concurrents à travers le monde .

En utilisant la même architecture de « mélange d'experts » (MoE) que DeepSeek, Qwen3 peut optimiser l'efficacité de calcul mais n'utiliser qu'une fraction du coût de formation. Il s’agit d’une méthode permettant de décomposer une tâche en parties distinctes et de ne suggérer que suffisamment de données approfondies pour l’exécuter.

Selon l'équipe de développement, Qwen3 prend en charge jusqu'à 119 langues et est formé sur un ensemble de données de près de 36 000 milliards de jetons, soit l'équivalent de 27 000 milliards de mots. Les données de formation proviennent de nombreuses sources telles que des manuels, des ensembles de questions-réponses, du code de programmation ou sont générées par l'IA,...

Ces améliorations, ainsi que bien d’autres, ont considérablement augmenté les capacités du chatbot par rapport à son prédécesseur, Qwen2. Techcrunch note que même si le Qwen 3 ne surpasse pas tout à fait les modèles haut de gamme récents comme l'o3 ou l'o4-mini d'OpenAI, ils affichent néanmoins des performances impressionnantes.

Alibaba ra mat AI moi anh 1

Comparez les résultats des tests d’évaluation. Photo : Qwen/X.

Qwen-3-235B-A22B, le plus grand modèle de la collection, a battu l'o3-mini d'OpenAI et le Gemini 2.5 Pro de Google sur Codeforces , la plate-forme de compétition de programmation populaire. Le logiciel a également surpassé o3-mini dans les tests de difficulté AIME et BFCL, qui évaluent la capacité de raisonnement d'un modèle.

Le Qwen-3-235B-A22B n'a pas encore été officiellement publié au public. En attendant, les utilisateurs peuvent télécharger Qwen3-32B. Le modèle surpasse le o1 d'OpenAI dans plusieurs benchmarks, y compris le test de programmation LiveCodeBench.

Alibaba affirme que Qwen3 excelle dans l'appel d'outils, la conformité des instructions et la réplication précise des formats de données. C’est un élément qui manque à de nombreux autres outils. Des recherches menées par l’Université Carnegie Mellon ont révélé que de nombreuses IA fabriquent des informations et modifient les formats même si on leur demande spécifiquement de le faire.

En plus du téléchargement sur les plateformes ci-dessus, les utilisateurs peuvent trouver Qwen3 via des fournisseurs de services cloud tels que Fireworks AI et Hyperbolic. Cela permet aux grandes et petites entreprises, ainsi qu’aux développeurs individuels, d’accéder et d’expérimenter au-delà des barrières.

L’émergence de certaines IA chinoises comme Qwen a accru la pression sur les laboratoires de recherche américains, les poussant à développer des technologies plus puissantes. En conséquence, les décideurs politiques du pays ont mis en place des restrictions pour limiter l’accès de la Chine aux puces.

Tuhin Srivastava, PDG de la société d'hébergement d'IA cloud Baseten, a déclaré que Qwen3 est un autre exemple du modèle open source qui rattrape les systèmes à source fermée comme OpenAI.

Qwen3 sera certainement toujours largement utilisé au niveau national malgré les restrictions imposées par le gouvernement américain. « Cela montre qu’en plus de s’appuyer sur des modèles existants comme Anthropic et OpenAI, les entreprises technologiques chinoises peuvent toujours développer leurs propres logiciels », a-t-il déclaré.

Source : https://znews.vn/them-loat-ai-manh-me-tu-trung-quoc-post1549756.html


Comment (0)

No data
No data

Patrimoine

Chiffre

Entreprise

No videos available

Nouvelles

Système politique

Locale

Produit