Chinese AI verslaat GPT-5

Baidu zegt dat hun AI beter is dan ChatGPT en Gemini. Foto: Baidu .

Tijdens het Baidu World 2025-evenement kondigde de Chinese gigant Baidu zijn volgende generatie platformmodel aan, een reeks AI-productupgrades en internationale expansieplannen. ERNIE 5.0 is dan ook een gepatenteerd model dat content in meerdere formaten, zoals tekst, afbeeldingen, audio en video , kan verwerken en creëren.

De groep wil een wereldspeler worden in de steeds competitievere AI-markt. ERNIE 5.0 verschijnt slechts enkele uren nadat OpenAI zijn vlaggenschipplatformmodel heeft geüpgraded van GPT-5 naar GPT-5.1, met de belofte het tokenverbruik te verminderen en de interactie-ervaring te verbeteren met meer menselijke opties.

ERNIE-4.5-VL-28B-A3B-Thinking, het onlangs uitgebrachte open source-model onder de bedrijfsvriendelijke Apache 2.0-licentie, biedt gebruikers alleen toegang tot de nieuwe chatbot via de ERNIE Bot-website van Baidu en de Qianfan Cloud Platform API voor institutionele klanten.

De modelvariant is ERNIE 5.0 Preview 1022, die geoptimaliseerd is voor taken met veel tekst, naast de algemene previewversie die meerdere gegevenstypen kan verwerken. Daarnaast introduceerde Baidu een reeks belangrijke upgrades voor het platform voor de "digitale mens", no-code tools en algemene AI-agents.

ERNIE 5.0 markeert een verschuiving in de manier waarop AI op grote schaal wordt ingezet, met als doel zijn AI-voetafdruk uit te breiden buiten de Chinese markt. "Het internaliseren van AI zal een aangeboren vermogen worden en AI transformeren van een kostenpost naar een bron van productiviteit", aldus CEO Robin Li.

ERNIE 5.0 toont superioriteit in het begrijpen van grafieken en documenten. Foto: Baidu.

Uit testresultaten blijkt dat ERNIE 5.0 op een breed scala aan taken bijna of gelijkwaardig presteert aan toonaangevende westerse platformmodellen. ERNIE 5.0 Preview presteert beter of gelijkwaardig dan GPT-5-High van OpenAI en Gemini 2.5 Pro van Google op tests van multimodaal redeneren, documentbegrip en het beantwoorden van vragen op basis van afbeeldingen.

Tegelijkertijd toont het model sterke taal- en code-uitvoeringsmogelijkheden. Het bedrijf benadrukt de mogelijkheid om multimodale input-outputcombinaties binnen hetzelfde model te verwerken, in plaats van het aaneenschakelen van post-processing datamodi, wat het team als een technisch onderscheidend kenmerk ziet.

Wat betreft beeldtaken scoorde ERNIE 5.0 de hoogste score op OCRBench, DocVQA en ChartQA, drie benchmarks die documentherkenning, inhoudelijk begrip en redeneren met gestructureerde data meten. Volgens Baidu presteerde het model beter dan zowel GPT-5-High als Gemini 2.5 Pro in tests met documenten en grafieken.

Op het gebied van beeldvorming behaalde ERNIE 5.0 resultaten die vergelijkbaar waren met of zelfs beter waren dan die van Google Veo3 in categorieën zoals semantische matching en beeldkwaliteit, volgens de interne evaluatie van Baidu. De multimodale integratie van het model maakt het mogelijk om visuele content te genereren en te interpreteren met een hoog niveau van contextueel begrip.

De ERNIE 5.0 is gepositioneerd voor een prijs en segment dat vergelijkbaar is met andere high-end modellen van Chinese concurrenten zoals Alibaba. Hij is duurder dan zijn voorganger, zoals de ERNIE 4.5 Turbo. Vergeleken met modellen uit de VS bevindt de prijs van de chatbot zich echter nog steeds in het middensegment.

Volgens Venturebeat illustreert dit Baidu's strategie om een duidelijk onderscheid te maken tussen goedkope modellen die veel verkeer genereren en modellen met hoge prestaties voor complexe taken en multimodale redeneringen.

Bron: https://znews.vn/ai-trung-quoc-danh-bai-gpt-5-post1602692.html