![]() |
Baidu behauptet, ihre KI sei besser als ChatGPT und Gemini. Foto: Baidu . |
Auf der Baidu World 2025 präsentierte der chinesische Konzern Baidu sein Plattformmodell der nächsten Generation, eine Reihe von KI-Produktverbesserungen und Pläne zur internationalen Expansion. Dabei handelt es sich bei ERNIE 5.0 um ein proprietäres Modell, das Inhalte in verschiedenen Formaten wie Text, Bildern, Audio und Video verarbeiten und erstellen kann.
Die Gruppe hat sich zum Ziel gesetzt, im zunehmend wettbewerbsintensiven KI-Markt eine globale Rolle zu spielen. ERNIE 5.0 erscheint nur wenige Stunden, nachdem OpenAI sein Flaggschiff-Plattformmodell von GPT-5 auf GPT-5.1 aktualisiert hat. Dies verspricht einen geringeren Token-Verbrauch und ein verbessertes Interaktionserlebnis mit mehr menschenähnlichen Optionen.
ERNIE-4.5-VL-28B-A3B-Thinking, das kürzlich unter der unternehmensfreundlichen Apache 2.0-Lizenz veröffentlichte Open-Source-Modell, ermöglicht es Benutzern, den neuen Chatbot nur über die ERNIE Bot-Website von Baidu und die Qianfan Cloud Platform API für institutionelle Kunden zu nutzen.
Die Modellvariante ist ERNIE 5.0 Preview 1022, die neben der allgemeinen Preview-Version, die verschiedene Datentypen verarbeiten kann, für textintensive Aufgaben optimiert ist. Darüber hinaus hat Baidu wichtige Aktualisierungen der „Digital Human“-Plattform, der No-Code-Tools und der universellen KI-Agenten eingeführt.
ERNIE 5.0 markiert einen Wendepunkt im großflächigen Einsatz von KI und zielt darauf ab, die KI-Präsenz über den chinesischen Markt hinaus auszuweiten. „Die Internalisierung von KI wird zu einer grundlegenden Fähigkeit und KI von einem Kostenfaktor zu einer Quelle der Produktivität machen“, so CEO Robin Li.
ERNIE 5.0 zeigt Überlegenheit beim Verständnis von Grafiken und Dokumenten. Foto: Baidu. |
Testergebnisse zeigen, dass ERNIE 5.0 bei einer Vielzahl von Aufgaben vergleichbare oder ähnliche Ergebnisse wie führende westliche Plattformmodelle erzielt. Die ERNIE 5.0 Preview übertrifft OpenAIs GPT-5-High und Googles Gemini 2.5 Pro in Tests zu multimodaler Argumentation, Dokumentenverständnis und bildbasierter Fragebeantwortung oder erreicht deren Leistung.
Gleichzeitig zeichnet sich das Modell durch starke Sprach- und Codeausführungsfähigkeiten aus. Das Unternehmen hebt die Fähigkeit hervor, multimodale Eingabe-Ausgabe-Kombinationen innerhalb desselben Modells zu verarbeiten, anstatt Datenmodi der Nachbearbeitung zu verketten. Dies sieht das Team als technisches Alleinstellungsmerkmal.
Bei Bildverarbeitungsaufgaben erzielte ERNIE 5.0 Bestnoten in den drei Benchmarks OCRBench, DocVQA und ChartQA, die Dokumentenerkennung, Inhaltsverständnis und das logische Denken mit strukturierten Daten messen. Laut Baidu übertraf das Modell sowohl GPT-5-High als auch Gemini 2.5 Pro in Tests mit Dokumenten und Diagrammen.
Im Bereich der Bildverarbeitung erzielte ERNIE 5.0 laut interner Evaluierung von Baidu Ergebnisse, die mit Google Veo3 in Kategorien wie semantischem Abgleich und Bildqualität vergleichbar waren oder diese sogar übertrafen. Die multimodale Integration des Modells ermöglicht die Generierung und Interpretation visueller Inhalte mit einem hohen Maß an Kontextverständnis.
ERNIE 5.0 ist preislich und segmentmäßig mit anderen High-End-Modellen chinesischer Konkurrenten wie Alibaba vergleichbar. Es liegt über dem Vorgängermodell ERNIE 4.5 Turbo. Im Vergleich zu US-amerikanischen Modellen befindet sich der Chatbot jedoch weiterhin im mittleren Preissegment.
Laut Venturebeat zeigt dies Baidus Strategie, klar zwischen kostengünstigen Modellen für hohes Datenaufkommen und leistungsstarken Modellen für komplexe Aufgaben und multimodales Denken zu unterscheiden.
Quelle: https://znews.vn/ai-trung-quoc-danh-bai-gpt-5-post1602692.html







Kommentar (0)