![]() |
Baidu říká, že jejich umělá inteligence je lepší než ChatGPT a Gemini. Foto: Baidu . |
Na akci Baidu World 2025 čínský gigant Baidu oznámil svůj model platformy nové generace, řadu vylepšení produktů s umělou inteligencí a plány na mezinárodní expanzi. ERNIE 5.0 je tedy proprietární model schopný zpracovávat a vytvářet obsah v různých formátech, jako je text, obrázky, zvuk a video .
Skupina si klade za cíl stát se globálním hráčem na stále konkurenčnějším trhu s umělou inteligencí. ERNIE 5.0 přichází jen několik hodin poté, co OpenAI upgradovala svůj vlajkový model platformy z GPT-5 na GPT-5.1 a slibuje snížení spotřeby tokenů a zlepšení interakce s větším počtem lidských možností.
ERNIE-4.5-VL-28B-A3B-Thinking, nedávno vydaný model s otevřeným zdrojovým kódem pod podnikovou licencí Apache 2.0, má k novému chatbotovi přístup pouze prostřednictvím webových stránek Baidu ERNIE Bot a Qianfan Cloud Platform API pro institucionální zákazníky.
Modelová varianta je ERNIE 5.0 Preview 1022, která je optimalizována pro úlohy s velkým množstvím textu, a to vedle obecné preview verze, která je schopna vyvažovat více datových typů. Baidu dále představil řadu důležitých vylepšení platformy „digitálního člověka“, nástroje bez kódování a univerzální agenty umělé inteligence.
ERNIE 5.0 představuje posun ve způsobu nasazování umělé inteligence ve velkém měřítku s cílem rozšířit její působnost i mimo čínský trh. „Internalizace umělé inteligence se stane vrozenou schopností a promění umělou inteligenci z nákladu na zdroj produktivity,“ uvedl generální ředitel Robin Li.
ERNIE 5.0 vykazuje převahu v porozumění grafům a dokumentům. Foto: Baidu. |
Výsledky testů ukazují, že ERNIE 5.0 dosahuje v široké škále úkolů blízkých nebo srovnatelných výsledků s předními západními platformními modely. ERNIE 5.0 Preview překonává nebo je srovnatelný s OpenAI GPT-5-High a Google Gemini 2.5 Pro v testech multimodálního uvažování, porozumění dokumentům a odpovídání na otázky na základě obrázků.
Zároveň model demonstruje silné jazykové a kódové schopnosti. Společnost klade důraz na schopnost zpracovávat multimodální kombinace vstupů a výstupů v rámci stejného modelu, spíše než na zřetězení režimů následného zpracování dat, což tým považuje za technický rozdíl.
Pokud jde o úlohy s obrázky, ERNIE 5.0 dosáhl nejvyšších výsledků v OCRBench, DocVQA a ChartQA, což jsou tři benchmarky, které měří rozpoznávání dokumentů, porozumění obsahu a uvažování se strukturovanými daty. Společnost Baidu uvedla, že model v testech zahrnujících dokumenty a grafy překonal jak GPT-5-High, tak Gemini 2.5 Pro.
V oblasti zobrazování dosáhl ERNIE 5.0 v kategoriích, jako je sémantické shodování a kvalita obrazu, srovnatelných nebo dokonce překonajících výsledky Google Veo3, jak vyplývá z interního hodnocení společnosti Baidu. Multimodální integrace modelu umožňuje generování a interpretaci vizuálního obsahu s vysokou úrovní kontextového porozumění.
ERNIE 5.0 je cenově a segmentově srovnatelný s jinými špičkovými modely od čínské konkurence, jako je Alibaba. Je dražší než předchozí produkt, jako například ERNIE 4.5 Turbo. Ve srovnání s modely z USA se však cena chatbota stále pohybuje ve střední cenové kategorii.
Podle Venturebeatu to ukazuje strategii Baidu, která chce jasně oddělit levné modely, které obsluhují vysokou návštěvnost, od vysoce výkonných modelů pro složité úkoly a multimodální uvažování.
Zdroj: https://znews.vn/ai-trung-quoc-danh-bai-gpt-5-post1602692.html







Komentář (0)