![]() |
Baidu affirme que son IA est meilleure que ChatGPT et Gemini. Photo : Baidu . |
Lors de l'événement Baidu World 2025, le géant chinois Baidu a annoncé son modèle de plateforme de nouvelle génération, une série d'améliorations de ses produits d'IA et ses plans d'expansion internationale. ERNIE 5.0 est ainsi un modèle propriétaire capable de traiter et de créer du contenu dans de multiples formats tels que le texte, les images, l'audio et la vidéo .
Le groupe ambitionne de devenir un acteur mondial sur le marché de l'IA, de plus en plus concurrentiel. ERNIE 5.0 arrive quelques heures seulement après la mise à jour par OpenAI de son modèle phare, GPT-5, vers GPT-5.1, promettant de réduire la consommation de jetons et d'améliorer l'expérience d'interaction grâce à des options plus humaines.
ERNIE-4.5-VL-28B-A3B-Thinking, le modèle open source récemment publié sous la licence Apache 2.0 adaptée aux entreprises, les utilisateurs ne peuvent accéder au nouveau chatbot que via le site Web ERNIE Bot de Baidu et l'API de la plateforme cloud Qianfan pour les clients institutionnels.
La variante proposée est ERNIE 5.0 Preview 1022, optimisée pour les tâches nécessitant un traitement important de texte, en plus de la version préliminaire générale capable de gérer plusieurs types de données. Par ailleurs, Baidu a également déployé d'importantes améliorations sur sa plateforme « humain numérique », ses outils sans code et ses agents d'IA généralistes.
ERNIE 5.0 marque un tournant dans le déploiement à grande échelle de l'IA, avec pour objectif d'étendre son influence au-delà du marché chinois. « L'intégration de l'IA deviendra une compétence innée et transformera l'IA d'un coût en une source de productivité », a déclaré le PDG Robin Li.
ERNIE 5.0 se distingue par sa capacité supérieure à interpréter les graphiques et les documents. Photo : Baidu. |
Les résultats des tests montrent qu'ERNIE 5.0 offre des performances proches ou équivalentes à celles des principaux modèles des plateformes occidentales sur un large éventail de tâches. La version préliminaire d'ERNIE 5.0 surpasse ou égale les performances de GPT-5-High d'OpenAI et de Gemini 2.5 Pro de Google lors des tests de raisonnement multimodal, de compréhension de documents et de réponse aux questions basées sur des images.
Parallèlement, le modèle démontre de solides capacités d'exécution de langage et de code. L'entreprise souligne sa capacité à gérer des combinaisons d'entrées-sorties multimodales au sein d'un même modèle, plutôt que de concaténer des modes de post-traitement des données, ce que l'équipe considère comme un avantage technique majeur.
Concernant les tâches de traitement d'images, ERNIE 5.0 a obtenu d'excellents résultats aux tests OCRBench, DocVQA et ChartQA, trois benchmarks évaluant la reconnaissance de documents, la compréhension de contenu et le raisonnement sur des données structurées. Baidu a indiqué que le modèle surpassait GPT-5-High et Gemini 2.5 Pro lors des tests portant sur des documents et des graphiques.
Dans le domaine de l'imagerie, ERNIE 5.0 a obtenu des résultats équivalents, voire supérieurs, à ceux de Google Veo3 dans des catégories telles que la correspondance sémantique et la qualité d'image, selon une évaluation interne de Baidu. L'intégration multimodale du modèle permet la génération et l'interprétation de contenu visuel avec un haut niveau de compréhension contextuelle.
ERNIE 5.0 se positionne sur un segment de prix équivalent à celui d'autres modèles haut de gamme de concurrents chinois tels qu'Alibaba. Son prix est supérieur à celui de produits précédents comme ERNIE 4.5 Turbo. Cependant, comparé aux modèles américains, le prix de ce chatbot reste dans la catégorie moyenne.
Selon Venturebeat, cela illustre la stratégie de Baidu qui consiste à bien distinguer les modèles à faible coût destinés à gérer un trafic important des modèles à hautes performances pour les tâches complexes et le raisonnement multimodal.
Source : https://znews.vn/ai-trung-quoc-danh-bai-gpt-5-post1602692.html







Comment (0)