Китайський ШІ перемагає GPT-5.

Baidu стверджує, що їхній штучний інтелект кращий за ChatGPT та Gemini. Фото: Baidu .

На заході Baidu World 2025 китайський гігант Baidu анонсував свою модель платформи наступного покоління, а також серію оновлень продуктів штучного інтелекту та плани міжнародної експансії. Відповідно, ERNIE 5.0 — це власна модель, здатна обробляти та створювати контент у різних форматах, таких як текст, зображення, аудіо та відео .

Мета компанії — стати глобальним конкурентом на дедалі більш конкурентному ринку штучного інтелекту. ERNIE 5.0 було запущено лише через кілька годин після того, як OpenAI оновив свою основну модель платформи з GPT-5 до GPT-5.1, обіцяючи зменшення споживання токенів та покращення взаємодії з більш орієнтованими на людину опціями.

ERNIE-4.5-VL-28B-A3B-Thinking, нещодавно випущена модель з відкритим вихідним кодом за корпоративною ліцензією Apache 2.0, дозволяє користувачам отримувати доступ до нового чат-бота лише через веб-сайт ERNIE Bot від Baidu та API хмарної платформи Qianfan для інституційних клієнтів.

Варіантом моделі є ERNIE 5.0 Preview 1022, оптимізований для завдань з інтенсивною обробкою тексту, а також загальна версія для попереднього перегляду, здатна балансувати різні типи даних. Крім того, Baidu представила низку значних оновлень своєї платформи «цифрова людина», включаючи інструменти без коду та універсальні агенти штучного інтелекту.

ERNIE 5.0 знаменує собою зміну у способах широкомасштабного впровадження штучного інтелекту, спрямовану на розширення впливу ШІ за межі китайського ринку. «Локалізація ШІ стане невід’ємною можливістю, перетворюючи штучний інтелект з витрат на актив підвищення продуктивності», – сказав генеральний директор Робін Лі.

ERNIE 5.0 демонструє чудові можливості розуміння графіків та документів. Зображення: Baidu.

Результати тестування показують, що ERNIE 5.0 досягла майже найвищої продуктивності на провідних західних платформах у широкому спектрі завдань. ERNIE 5.0 Preview перевершує або зрівняється з GPT-5-High від OpenAI та Gemini 2.5 Pro від Google у тестах мультимодального мислення, розуміння документів та відповідей на запитання на основі зображень.

Водночас модель демонструє потужні можливості в мовному плані та виконанні коду. Компанія наголошує на здатності обробляти комбіновані мультимодальні вхідні-вихідні дані в межах однієї моделі, а не на об'єднанні режимів постобробки даних, що команда вважає ключовим фактором відмінності.

Що стосується обробки зображень, ERNIE 5.0 досягла найвищих балів у OCRBench, DocVQA та ChartQA — трьох бенчмарках, які оцінюють розпізнавання документів, розуміння контенту та логічне мислення зі структурованими даними. Baidu заявила, що модель перевершила як GPT-5-High, так і Gemini 2.5 Pro у тестах, пов’язаних з документами та діаграмами.

Згідно з внутрішньою оцінкою Baidu, ERNIE 5.0 досягла результатів, рівних або перевершуючих Google Veo3, у таких категоріях, як семантична відповідність та якість зображення. Можливості мультимодальної інтеграції моделі дозволяють створювати та інтерпретувати візуальний контент з високим ступенем контекстного розуміння.

ERNIE 5.0 позиціонується за вартістю та сегментом, порівнянним з іншими висококласними моделями від китайських конкурентів, таких як Alibaba. Він дорожчий за свого попередника, ERNIE 4.5 Turbo. Однак, порівняно з моделями з США, ціна чат-бота все ще знаходиться в середньому діапазоні.

За даними Venturebeat, це демонструє стратегію Baidu, яка чітко розмежовує недорогі моделі, що обслуговують високий трафік, та моделі з високою продуктивністю для складних завдань та мультимодального мислення.

Джерело: https://znews.vn/ai-trung-quoc-danh-bai-gpt-5-post1602692.html