Baidus „KI-Monster“ ERNIE 5.1 arbeitet mit 94 % geringeren Kosten.

Baidus Flaggschiffprodukt ERNIE, das kürzlich auf Version 5.1 aktualisiert wurde, begeistert die globale Tech-Community mit seinen beispiellosen Kosteneinsparungsmöglichkeiten.

Báo Khoa học và Đời sống•15/05/2026

Inmitten eines globalen Wettlaufs um künstliche Intelligenz, bei dem Milliarden von Dollar für Rechenleistung ausgegeben werden, hat Baidu, oft als „Chinas Google“ bezeichnet, mit der offiziellen Einführung seines großen Sprachmodells ERNIE 5.1 für einen großen Schock gesorgt.

Der auffälligste Aspekt liegt nicht nur in seiner überlegenen Rechenleistung, sondern auch in seinem beeindruckenden wirtschaftlichen Wert: Die Trainingskosten dieses Modells sind etwa 94 % niedriger als die vergleichbarer KI-Systeme. Dies gilt als vielversprechende Lösung für die Ressourcenoptimierung in der nächsten Generation der KI.

Netzwerkkomprimierungstechnologie und die „Einmal trainieren, alle trainieren“-Strategie.

Um zu verstehen, warum Baidu die Kosten in einem so unglaublichen Ausmaß senken konnte, muss man sich ansehen, wie sie ERNIE 5.1 aufgebaut haben.

Anstatt den traditionellen Weg zu beschreiten und ein komplett neues Modell von Grund auf zu trainieren, wählte Baidu eine Methode des „multidimensionalen elastischen Vortrainings“. Konkret handelt es sich bei ERNIE 5.1 nicht um eine völlig unabhängige Einheit, sondern um eine Weiterentwicklung seines Vorgängers ERNIE 5.0 (veröffentlicht im Januar 2026).

Baidu nutzt ein flexibles Trainingsframework namens „Once-For-All“. Anstatt für jede Modellgröße separate und teure Trainingsläufe durchzuführen, optimiert das Unternehmen eine ganze „Familie“ von Modellen unterschiedlicher Größe in einem einzigen Durchlauf.

2ffca8ca25c14b56a38a3c3a7917bb8etplv-73owjymdk6-jj-mark-v1-0-0-0-0-5o6y6yer5oqa5pyv56s-5yy6ieagrwfzeuxmtq-q75.jpg — Die Trainingsmethode der „multidimensionalen Elastizität“ reduziert die Kosten von Ernie 5.1 um 94 %.

Diese Modelle weisen zwar ähnliche Gewichtungen auf, unterscheiden sich jedoch in Tiefe, Breite und der Anzahl aktivierter Expertenblöcke. Aus der massiven Architektur von ERNIE 5.0 mit etwa 2,4 Billionen Parametern extrahierte Baidu ein optimiertes Subnetz, um ERNIE 5.1 zu entwickeln.

Das Ergebnis ist ein optimiertes Modell, dessen Parameteranzahl nur noch etwa ein Drittel der ursprünglichen beträgt. Insbesondere die Anzahl der operativen Parameter, also jener Teile, die tatsächlich an der Verarbeitung von Feedback in einem Gespräch beteiligt sind, wurde halbiert.

Die Übernahme der umfangreichen Wissensbasis des „Elternmodells“, ohne den gesamten kostspieligen Trainingsprozess wiederholen zu müssen, ist der Schlüssel dafür, dass Baidu bis zu 94 % seines Budgets einsparen kann.

Darüber hinaus hat Baidu sein Reinforcement-Learning-System komplett umstrukturiert. Anstatt Modellaktualisierungen, Feedbackgenerierung und Auswertung starr miteinander zu verknüpfen, wurden diese in unabhängige Subsysteme aufgeteilt, die von einer zentralen Steuereinheit koordiniert werden.

Dadurch kann jede Komponente auf der am besten geeigneten Hardware ausgeführt werden, sodass ein Engpass in einem Schritt nicht den gesamten Prozess verlangsamt.

Um das Problem der Rechenverzerrung in Mixed-Expert-Modellen (MoE) anzugehen, implementierte Baidu außerdem eine standardisierte Bibliothek für Berechnungen mit niedriger Präzision, wodurch die Instabilität halbiert wurde, ohne die Verarbeitungsgeschwindigkeit zu verringern.

Dem „Wippeneffekt“ kann mit einem vierstufigen Trainingsprozess entgegengewirkt werden.

Eine inhärente Herausforderung beim Training großer KI-Modelle ist der „Wippeneffekt“. Wenn Entwickler versuchen, der KI mehrere Fähigkeiten gleichzeitig beizubringen, führt eine Verbesserung in einem Bereich oft zu einer Verschlechterung in einem anderen.

Wenn ein Modell beispielsweise mathematisch versierter wird, können seine kreativen Schreibfähigkeiten negativ beeinflusst werden.

Um diesem Problem zu begegnen, hat Baidu einen vierstufigen Verfeinerungsprozess eingeführt, den sie MOPD (Multi-Teacher On-Policy Distillation) nennen.

0b5a83e4e4334df8a56ae72d29199bfdtplv-73owjymdk6-jj-mark-v1-0-0-0-0-5o6y6yer5oqa5pyv56s-5yy6ieagrwfzeuxmtq-q75.jpg — Baidus vierstufiger Schulungsprozess.

Die erste Phase beginnt mit einem standardisierten, überwachten Training anhand eines großen Datensatzes.

In der zweiten Phase trainiert Baidu parallel mehrere separate Expertenmodelle für Bereiche wie Programmierung, logisches Denken und Agentenaufgaben, wobei jedes Modell seine eigenen Bewertungssignale hat.

In der dritten Phase lernt ein einzelnes „Schüler“-Modell gleichzeitig von all diesen Experten-„Lehrern“, indem es eigene Antworten generiert und diese mit den Ergebnissen der Experten vergleicht.

Die letzte Phase beinhaltet allgemeines bestärkendes Lernen für offene Dialoge und kreative Aufgaben.

Laut Baidu ist dieser letzte Schritt von entscheidender Bedeutung, da der Destillationsprozess vom Lehrer zum Schüler manchmal Antworten hervorbringt, die übermäßig glattgebügelt sind, aber an Vielfalt mangeln.

Dank dieses Prozesses erreicht ERNIE 5.1 ein Gleichgewicht der Kompetenzniveaus und verhindert, dass ein Bereich überbewertet wird und andere Bereiche in den Schatten stellt.

Führende Leistung und der Anspruch, den Weltmarkt zu dominieren.

Baidus Optimierungsbemühungen haben sich in den Rankings bewährt. Auf der LMArena Search Arena, wo KI-Modelle von echten Nutzern anhand von Live-Websuchen bewertet werden, erreichte ERNIE 5.1 am 9. Mai eine Punktzahl von 1.223.

Mit dieser Punktzahl belegt es weltweit den 4. Platz und ist das Spitzenmodell unter allen in China entwickelten Modellen.

ernie-5-1-01-lmarena-search-ranking-1778639140714-1778639141083628747758-4531.jpg — Ernie 5.1 stieg sofort in die Top 4 der LMArena-Rangliste ein.

In intensiven Wissens- und Denktests erreichte ERNIE 5.1 annähernd die Leistung führender westlicher Closed-Source-Modelle wie Googles Gemini 3.1 Pro.

Im Mathematikwettbewerb AIME26 erreichte dieses Modell bei der Verwendung von Schlussfolgerungswerkzeugen eine Genauigkeit von 99,6 % und belegte damit den zweiten Platz hinter Gemini 3.1 Pro.

Insbesondere bei Aufgaben, die „Agenturfähigkeiten“ erfordern, wie die Verarbeitung komplexer Tabellenkalkulationen oder das automatisierte mehrstufige Surfen im Internet, übertraf ERNIE 5.1 DeepSeek-V4-Pro – das Modell, das zuvor in China den Rekord hielt.

Die Erfolgsgeschichte von ERNIE 5.1 erinnert an die Wirkung von DeepSeek R1 Anfang 2025, als das Startup demonstrierte, dass es möglich war, eine mit OpenAI o1 vergleichbare Leistung zu 98 % geringeren Kosten zu erzielen.

Während DeepSeek sich jedoch auf die Effizienz des logischen Denkens konzentriert, gelingt ERNIE 5.1 bereits in der ersten Trainingsphase ein Durchbruch.

Die Botschaft von Baidu ist eindeutig: Chinesische KI-Labore suchen ständig nach innovativen Wegen, „mit weniger mehr zu erreichen“, anstatt einfach nur mehr Hardwareleistung in das System zu investieren.

ERNIE 5.1 wird derzeit in über zehn Kreativplattformen und Agenturen in China flächendeckend eingesetzt. Nutzer können dieses Modell beispielsweise in Anwendungen wie der Rollenspielplattform Isekai Zero, dem Kurzfilm-Tool Storymaster oder der Grafik-App Diting Huanliu erleben.

Entschlüsseln, der Decoder

Quelle: https://khoahocdoisong.vn/quai-vat-ai-ernie-51-cua-baidu-van-hanh-with-lower-cost-than-94-post2149100260.html