Uprostřed globálního závodu v oblasti umělé inteligence, který utrácí miliardy dolarů za výpočetní výkon, způsobil Baidu, často označovaný jako „čínský Google“, velký šok oficiálním spuštěním svého modelu programovacího jazyka ERNIE 5.1.
Nejvýraznějším aspektem jsou nejen jeho vynikající výpočetní schopnosti, ale také působivá ekonomická hodnota: náklady na školení tohoto modelu jsou přibližně o 94 % nižší než u systémů umělé inteligence podobného rozsahu. To je vnímáno jako nové řešení problému optimalizace zdrojů v příští generaci umělé inteligence.

Technologie komprese sítě a strategie „natrénovat jednou, natrénovat vše“.
Abychom pochopili, proč se Baidu podařilo snížit náklady v tak neuvěřitelné míře, je třeba se podívat na to, jak postavili ERNIE 5.1.
Místo tradiční cesty trénování zcela nového modelu od nuly zvolil Baidu metodu „vícerozměrného elastického předtrénování“. Konkrétně ERNIE 5.1 není zcela nezávislou entitou, ale je vyvinut na základě svého předchůdce, ERNIE 5.0 (spuštěného v lednu 2026).
Společnost Baidu použila elastický trénovací rámec s názvem „Once-For-Awl“. Namísto spouštění samostatných a nákladných trénovacích běhů pro každou různou velikost modelu společnost optimalizuje celou „rodinu“ modelů různých velikostí v jednom běhu.

Tyto modely sdílejí váhy, ale liší se hloubkou, šířkou a počtem aktivovaných expertních bloků. Z masivní architektury ERNIE 5.0 s přibližně 2,4 biliony parametrů Baidu extrahoval optimalizovanou podsíť pro vytvoření ERNIE 5.1.
Výsledkem je zjednodušený model, jehož celkový počet parametrů představuje pouze zhruba třetinu původního počtu. Zejména počet provozních parametrů, tedy těch částí, které se skutečně podílejí na zpracování zpětné vazby v konverzaci, byl snížen na polovinu.
Zdědění rozsáhlé znalostní základny od svého „mateřského“ modelu bez opakování celého nákladného procesu školení je klíčem k tomu, aby Baidu ušetřilo až 94 % svého rozpočtu.
Společnost Baidu navíc kompletně restrukturalizovala svůj systém posilovacího učení. Místo pevného propojení aktualizací modelů, generování zpětné vazby a vyhodnocování běhů je oddělila do nezávislých subsystémů koordinovaných centrální řídicí jednotkou.
To umožňuje každé komponentě běžet na nejvhodnějším hardwaru, což zajišťuje, že úzké hrdlo v jednom kroku nezpomalí celý proces.
Aby se vyřešil problém výpočetního zkreslení v modelech se smíšenými experty (MoE), Baidu také implementoval standardizovanou knihovnu pro výpočet s nízkou přesností, která snížila nestabilitu na polovinu bez snížení rychlosti zpracování.
Řešte „efekt houpačky“ čtyřfázovým tréninkovým procesem.
Inherentní výzvou při trénování velkých modelů umělé inteligence je „efekt houpačky“. Když se vývojáři snaží naučit umělou inteligenci více dovedností současně, zlepšení v jedné oblasti často vede k poklesu v jiné.
Například s tím, jak se model stává matematicky zdatnějším, mohou být negativně ovlivněny jeho schopnosti tvůrčího psaní.
Aby se tento problém vyřešil, Baidu zavedl čtyřstupňový proces zpřesňování, který nazývají MOPD (Multi-Teacher On-Policy Distillation).

První fáze začíná standardizovaným kontrolovaným tréninkem na velké datové sadě.
Ve druhé fázi Baidu trénuje paralelně několik samostatných expertních modelů pro oblasti, jako je programování, logické uvažování a úkoly agentů, přičemž každý z nich má své vlastní vyhodnocovací signály.
Ve třetí fázi se jeden model „studenta“ bude učit současně od všech těchto expertních „učitelů“ generováním vlastních odpovědí a jejich porovnáváním s výsledky expertů.
Závěrečná fáze zahrnuje obecné posilovací učení pro otevřené dialogy a kreativní úkoly.
Podle Baidu je tento poslední krok klíčový, protože proces destilace od učitele ke studentovi někdy vede k odpovědím, které jsou až příliš propracované, ale postrádají rozmanitost.
Díky tomuto procesu dosahuje ERNIE 5.1 rovnováhy v úrovních dovedností a zabraňuje tomu, aby kterákoli oblast byla nadměrně upřednostňována a zastíněna ostatními.
Špičkový výkon a ambice ovládnout globální trh.
Optimalizační úsilí společnosti Baidu přineslo konkrétní výsledky v renomovaných žebříčcích. Na LMArena Search Arena, kde modely umělé inteligence hodnotí skuteční uživatelé prostřednictvím úkolů živého vyhledávání na webu, dosáhl ERNIE 5.1 k 9. květnu skóre 1 223.
Díky tomuto skóre se umístil na 4. místě na světě a drží první místo mezi všemi modely vyvinutými v Číně.

V intenzivních testech znalostí a uvažování se ERNIE 5.1 přiblížil výkonu předních západních modelů s uzavřeným zdrojovým kódem, jako je například Gemini 3.1 Pro od Googlu.
V matematické soutěži AIME26 dosáhl tento model při použití nástrojů pro uvažování přesnosti 99,6 %, čímž se umístil na druhém místě hned za Gemini 3.1 Pro.
Zejména v úkolech zahrnujících „agenturní schopnosti“, jako je zpracování složitých tabulek nebo automatizované vícekrokové prohlížení webu, ERNIE 5.1 překonal DeepSeek-V4-Pro – model, který dříve držel rekord v Číně.
Příběh o efektivitě ERNIE 5.1 připomíná dopad DeepSeek R1 na začátku roku 2025, kdy startup prokázal, že je možné dosáhnout výkonu srovnatelného s OpenAI o1 s o 98 % nižšími náklady.
Zatímco se DeepSeek zaměřuje na efektivitu uvažování, ERNIE 5.1 dělá průlom hned v počáteční fázi tréninku.
Zpráva, kterou Baidu vysílá, je jasná: čínské laboratoře umělé inteligence neustále nacházejí inovativní způsoby, jak „dělat více s menšími náklady“, spíše než se spoléhat pouze na to, že do systému nalijí více hardwarového výkonu.
V současné době je ERNIE 5.1 široce nasazen na více než 10 kreativních platformách a agenturách v Číně. Uživatelé si mohou tento model vyzkoušet prostřednictvím aplikací, jako je platforma pro hraní rolí Isekai Zero, nástroj pro tvorbu krátkých filmů Storymaster nebo grafická aplikace Diting Huanliu.
Zdroj: https://khoahocdoisong.vn/quai-vat-ai-ernie-51-cua-baidu-van-hanh-with-lower-cost-than-94-post2149100260.html











Komentář (0)