![]() |
Baidu каже, що їхній штучний інтелект кращий за ChatGPT та Gemini. Фото: Baidu . |
На заході Baidu World 2025 китайський гігант Baidu анонсував свою модель платформи наступного покоління, серію оновлень продуктів штучного інтелекту та плани міжнародної експансії. Відповідно, ERNIE 5.0 — це власна модель, здатна обробляти та створювати контент у різних форматах, таких як текст, зображення, аудіо та відео .
Група прагне стати глобальним гравцем на дедалі конкурентнішому ринку штучного інтелекту. ERNIE 5.0 з'явився лише через кілька годин після того, як OpenAI оновив свою флагманську модель платформи з GPT-5 до GPT-5.1, обіцяючи зменшити споживання токенів та покращити взаємодію завдяки більшій кількості людських опцій.
ERNIE-4.5-VL-28B-A3B-Thinking, нещодавно випущена модель з відкритим кодом за корпоративною ліцензією Apache 2.0, користувачі можуть отримати доступ до нового чат-бота лише через веб-сайт Baidu ERNIE Bot та API хмарної платформи Qianfan для інституційних клієнтів.
Варіантом моделі є ERNIE 5.0 Preview 1022, оптимізований для завдань з великим обсягом тексту, на додаток до загальної попередньої версії, яка здатна балансувати різні типи даних. Крім того, Baidu також представила низку важливих оновлень платформи «цифрова людина», інструменти без коду та універсальні агенти штучного інтелекту.
ERNIE 5.0 знаменує собою зміну в масштабному розгортанні штучного інтелекту, спрямовану на розширення його впливу за межі китайського ринку. «Інтерналізація штучного інтелекту стане вродженою здатністю та перетворить штучний інтелект з витрат на джерело продуктивності», – сказав генеральний директор Робін Лі.
ERNIE 5.0 демонструє перевагу в розумінні графіків та документів. Фото: Baidu. |
Результати тестування показують, що ERNIE 5.0 працює близько або на рівні з провідними західними моделями платформ у широкому спектрі завдань. ERNIE 5.0 Preview перевершує або знаходиться на одному рівні з GPT-5-High від OpenAI та Gemini 2.5 Pro від Google у тестах мультимодального мислення, розуміння документів та відповідей на запитання на основі зображень.
Водночас модель демонструє потужні можливості мови програмування та виконання коду. Компанія наголошує на здатності обробляти багатомодальні комбінації вводу-виводу в межах однієї моделі, а не на об'єднанні режимів постобробки даних, що команда розглядає як технічну відмінність.
Щодо завдань із зображеннями, ERNIE 5.0 отримав найвищі оцінки в OCRBench, DocVQA та ChartQA – трьох бенчмарках, які вимірюють розпізнавання документів, розуміння контенту та міркування зі структурованими даними. Baidu зазначив, що модель перевершила як GPT-5-High, так і Gemini 2.5 Pro в тестах, що включають документи та діаграми.
Згідно з внутрішньою оцінкою Baidu, у сфері обробки зображень ERNIE 5.0 досягла результатів, що відповідають або перевищують Google Veo3, у таких категоріях, як семантичне зіставлення та якість зображення. Мультимодальна інтеграція моделі дозволяє генерувати та інтерпретувати візуальний контент з високим рівнем контекстного розуміння.
ERNIE 5.0 позиціонується за вартістю та сегментом, еквівалентним іншим висококласним моделям від китайських конкурентів, таких як Alibaba. Він вищий, ніж попередній продукт, такий як ERNIE 4.5 Turbo. Однак, порівняно з моделями з США, ціна чат-бота все ще знаходиться в середньому діапазоні.
За даними Venturebeat, це демонструє стратегію Baidu, яка полягає в тому, щоб чітко розмежувати недорогі моделі, що обслуговують високий трафік, та високопродуктивні моделі для складних завдань та мультимодального мислення.
Джерело: https://znews.vn/ai-trung-quoc-danh-bai-gpt-5-post1602692.html







Коментар (0)