![]() |
Baidu tvrdí, že jeho umělá inteligence je lepší než ChatGPT a Gemini. Foto: Baidu . |
Na akci Baidu World 2025 čínský gigant Baidu oznámil svůj model platformy nové generace spolu s řadou vylepšení produktů umělé inteligence a plány na mezinárodní expanzi. ERNIE 5.0 je tedy proprietární model schopný zpracovávat a vytvářet obsah v různých formátech, jako je text, obrázky, zvuk a video .
Cílem společnosti je stát se globálním konkurentem na stále konkurenčnějším trhu s umělou inteligencí. Platforma ERNIE 5.0 byla spuštěna jen několik hodin poté, co OpenAI upgradovala svůj základní platformní model z GPT-5 na GPT-5.1, slibujíc sníženou spotřebu tokenů a vylepšené interakce s možnostmi více zaměřenými na člověka.
ERNIE-4.5-VL-28B-A3B-Thinking, nedávno vydaný open-source model pod podnikovou licencí Apache 2.0, umožňuje uživatelům přístup k novému chatbotovi pouze prostřednictvím webových stránek ERNIE Bot společnosti Baidu a cloudového API platformy Qianfan pro institucionální klienty.
Variantou modelu je ERNIE 5.0 Preview 1022, optimalizovaná pro textově náročné úlohy, spolu s obecnou preview verzí schopnou vyvažovat různé datové typy. Baidu navíc představil řadu významných vylepšení své platformy „digitálního člověka“, včetně nástrojů bez kódování a všestranných agentů umělé inteligence.
ERNIE 5.0 představuje posun ve způsobu, jakým je umělá inteligence nasazována ve velkém měřítku, s cílem rozšířit její působnost i mimo čínský trh. „Lokalizace umělé inteligence se stane inherentní schopností a promění umělou inteligenci z nákladů v produktivní aktivum,“ uvedl generální ředitel Robin Li.
ERNIE 5.0 prokazuje vynikající schopnosti v porozumění grafům a dokumentům. Obrázek: Baidu. |
Výsledky testů ukazují, že ERNIE 5.0 dosáhl téměř špičkového výkonu na předních západních platformách v široké škále úloh. ERNIE 5.0 Preview překonává nebo se vyrovná OpenAI GPT-5-High a Google Gemini 2.5 Pro v testech multimodálního uvažování, porozumění dokumentům a odpovídání na otázky na základě obrázků.
Zároveň model demonstruje silné jazykové a kódové schopnosti. Společnost klade důraz na schopnost zpracovávat kombinovaný multimodální vstup a výstup v rámci stejného modelu, spíše než na zřetězení datových režimů následného zpracování, což tým považuje za klíčový rozlišovací faktor.
Pokud jde o zpracování obrazu, ERNIE 5.0 dosáhl nejvyšších skóre v OCRBench, DocVQA a ChartQA – třech benchmarkech, které hodnotí rozpoznávání dokumentů, porozumění obsahu a uvažování se strukturovanými daty. Společnost Baidu uvedla, že model v testech souvisejících s dokumenty a grafy překonal jak GPT-5-High, tak Gemini 2.5 Pro.
Pokud jde o tvorbu obrázků, ERNIE 5.0 dosáhl v kategoriích, jako je sémantická shoda a kvalita obrazu, stejných nebo dokonce lepších výsledků než Google Veo3, dle interního hodnocení společnosti Baidu. Multimodální integrační schopnosti modelu umožňují vytváření a interpretaci vizuálního obsahu s vysokým stupněm kontextového porozumění.
ERNIE 5.0 je cenově a v segmentu srovnatelný s jinými špičkovými modely od čínské konkurence, jako je Alibaba. Je dražší než jeho předchůdce, ERNIE 4.5 Turbo. Ve srovnání s modely z USA se však cena chatbota stále pohybuje ve středním cenovém rozpětí.
Podle Venturebeatu to ukazuje strategii Baidu jasně rozlišovat mezi nízkonákladovými modely obsluhujícími vysokou návštěvnost a modely s vysokou kapacitou pro složité úkoly a multimodální uvažování.
Zdroj: https://znews.vn/ai-trung-quoc-danh-bai-gpt-5-post1602692.html







Komentář (0)