Vietnam.vn - Nền tảng quảng bá Việt Nam

Une série d'IA plus puissante en provenance de Chine

Le modèle peut rivaliser avec des concurrents puissants dans le monde entier, ce qui témoigne du potentiel technologique croissant du pays d’un milliard d’habitants.

ZNewsZNews29/04/2025

Qwen3, une nouvelle technologie lancée par Alibaba. Photo : Reuters .

Le 28 avril, le géant technologique chinois Alibaba a lancé une série de modèles d'IA baptisés Qwen3. L'entreprise affirme que ce chatbot peut égaler, voire surpasser, les meilleurs modèles actuels d'OpenAI ou de Google dans certains cas.

Avec une taille pouvant atteindre 235 milliards de paramètres, Qwen3 est comparable à DeepSeek-V2 et OpenAI GPT-4, qui en comptent respectivement environ 236 et 175 milliards. Les utilisateurs pourront bientôt le télécharger sous licence libre sur la plateforme de développement d'IA Hugging Face et sur GitHub dès la sortie de la série de modèles.

L'entreprise affirme que la collection Qwen3 comprend des modèles hybrides, ce qui signifie qu'ils peuvent raisonner de manière flexible pour résoudre des problèmes complexes ou répondre rapidement à des demandes simples. Dans ce cas, la capacité de raisonnement permet au modèle de vérifier lui-même l'exactitude des informations, mais au prix d'une latence élevée.

Cette conception permet aux utilisateurs d'allouer facilement le budget approprié à chaque tâche spécifique. De plus, ce modèle s'inspire également de nombreux concurrents à travers le monde .

Grâce à une architecture de « mélange d'experts » (MoE) similaire à DeepSeek, Qwen3 peut maximiser l'efficacité de calcul à un coût de formation bien inférieur. Cette méthode permet de décomposer une tâche en plusieurs parties et de recommander uniquement la quantité de données approfondies nécessaire à son exécution.

Selon l'équipe de développement, Qwen3 prend en charge jusqu'à 119 langues et s'appuie sur un ensemble de données de près de 36 000 milliards de jetons, soit l'équivalent de 27 000 milliards de mots. Les données d'entraînement proviennent de nombreuses sources, telles que des manuels scolaires, des questionnaires, du code de programmation ou des IA auto-générées.

Ces améliorations, parmi bien d'autres, ont considérablement amélioré les capacités du chatbot par rapport à son prédécesseur, Qwen2. Techcrunch note que même si Qwen 3 ne surpasse pas encore complètement les modèles phares récents comme o3 ou o4-mini d'OpenAI, ses performances restent impressionnantes.

Alibaba ra mat AI moi anh 1

Comparaison des résultats des tests d'évaluation. Photo : Qwen/X.

Qwen-3-235B-A22B, le plus grand modèle de la collection, a battu o3-mini d'OpenAI et Gemini 2.5 Pro de Google sur Codeforces , une plateforme de compétition de programmation populaire. Il a également surpassé o3-mini aux problèmes mathématiques AIME et BFCL, qui mesurent la capacité de raisonnement d'un modèle.

Qwen-3-235B-A22B n'a pas encore été officiellement publié. En attendant, les utilisateurs peuvent télécharger Qwen3-32B. Ce modèle a surpassé le o1 d'OpenAI lors de plusieurs évaluations, notamment le test de programmation LiveCodeBench.

Alibaba affirme que Qwen3 excelle dans l'appel d'outils, le suivi des instructions et la copie précise des formats de données, ce qui fait défaut à de nombreux autres outils. Des recherches menées à l'Université Carnegie Mellon ont montré que de nombreuses IA fabriquent des informations et modifient les formats malgré des instructions spécifiques.

Outre le téléchargement sur les plateformes mentionnées ci-dessus, les utilisateurs peuvent accéder à Qwen3 via des fournisseurs de services cloud tels que Fireworks AI et Hyperbolic. Cela permet aux grandes et petites entreprises, ainsi qu'aux programmeurs individuels, d'accéder à Qwen3 et de l'expérimenter au-delà des barrières.

L’émergence d’IA chinoises comme Qwen a accru la pression sur les laboratoires de recherche américains pour développer des technologies plus puissantes, incitant les décideurs politiques américains à imposer des restrictions à l’accès de la Chine aux puces.

Tuhin Srivastava, PDG de la société d'hébergement d'IA cloud Baseten, a déclaré que Qwen3 est un autre exemple du modèle open source qui rattrape les systèmes à source fermée comme OpenAI.

Qwen3 continuera certainement d'être largement utilisé au niveau national malgré les restrictions imposées par le gouvernement américain. « Cela montre qu'en plus de s'appuyer sur des modèles existants comme Anthropic et OpenAI, les entreprises technologiques chinoises peuvent toujours développer leurs propres logiciels », a-t-il déclaré.

Source : https://znews.vn/them-loat-ai-manh-me-tu-trung-quoc-post1549756.html


Comment (0)

No data
No data
Scène magique sur la colline de thé « bol renversé » à Phu Tho
Trois îles de la région centrale sont comparées aux Maldives et attirent les touristes en été.
Admirez la ville côtière scintillante de Gia Lai à Quy Nhon la nuit
Image de champs en terrasses à Phu Tho, en pente douce, lumineux et beaux comme des miroirs avant la saison des plantations
L'usine Z121 est prête pour la soirée finale du feu d'artifice international
Un célèbre magazine de voyage fait l'éloge de la grotte de Son Doong comme étant « la plus magnifique de la planète »
Une grotte mystérieuse attire les touristes occidentaux, comparée à la « grotte de Phong Nha » à Thanh Hoa
Découvrez la beauté poétique de la baie de Vinh Hy
Comment est transformé le thé le plus cher de Hanoi, dont le prix dépasse les 10 millions de VND/kg ?
Goût de la région fluviale

Patrimoine

Chiffre

Entreprise

No videos available

Nouvelles

Système politique

Locale

Produit