DeepSeek було скинуто з трону.

Модель штучного інтелекту Qwen3 від Alibaba пройшла тест R1 у тестах LiveBench, які оцінюють можливості моделей з відкритим кодом у програмуванні, математиці та аналізі даних.

ZNews•06/05/2025

Qwen3, нова технологія, запущена Alibaba. Фото: SCMP .

Згідно з останніми тестами штучного інтелекту, нещодавно випущена модель штучного інтелекту Qwen3 від Alibaba перевершила R1 від DeepSeek, ставши найвище оціненою моделлю з відкритим кодом у світі .

Зокрема, дані LiveBench, незалежної платформи, яка оцінює великі мовні моделі (LLM), базову технологію для генеративних сервісів штучного інтелекту, таких як ChatGPT, показують, що Qwen3 перевершив R1 у тестах.

Оцінка можливостей моделей штучного інтелекту з відкритим кодом включає програмування, математику, аналіз даних та навчання мовам.

28 квітня Alibaba випустила свою серію моделей Qwen3 зі штучним інтелектом. Компанія стверджує, що цей чат-бот може конкурувати, а в деяких випадках навіть перевершити найкращі сучасні моделі від OpenAI або Google.

Маючи розмір до 235 мільярдів параметрів, Qwen3 має продуктивність, порівнянну з DeepSeek-V2 та OpenAI GPT-4, які мають приблизно 236 мільярдів та 175 мільярдів параметрів відповідно. Користувачі незабаром зможуть завантажити його за відкритою ліцензією на платформі розробки штучного інтелекту Hugging Face та Github, як тільки буде випущено цю серію моделей.

Компанія заявила, що колекція Qwen3 включає гібридні моделі, тобто вони можуть гнучко розподіляти час на міркування для вирішення складних проблем або швидко реагувати на прості запити. У цій моделі можливість міркування дозволяє самостійно перевіряти точність інформації, але це пов'язано зі значним часовим затримкою.

Такий дизайн дозволяє користувачам легко розподіляти бюджет відповідно до кожного конкретного завдання. Крім того, ця модель також вчиться у багатьох конкурентів по всьому світу.

Використовуючи архітектуру «суміші експертів» (MoE), подібну до DeepSeek, Qwen3 може оптимізувати обчислювальну продуктивність, використовуючи лише частину витрат на навчання. Цей метод розбиває завдання на багато окремих частин і вимагає лише достатньої кількості даних, що містять багато даних, для їх виконання.

За словами команди розробників, Qwen3 підтримує до 119 мов і навчається на наборі даних майже з 36 трильйонів токенів, що еквівалентно 27 трильйонам слів. Дані для навчання отримуються з різних джерел, таких як підручники, набори питань і відповідей, програмний код або навіть дані, згенеровані штучним інтелектом тощо.

Незважаючи на те, що Qwen3 очолює рейтинг програмного забезпечення з відкритим вихідним кодом, розширений тест LiveBench показує, що він все ще відстає від провідних світових моделей штучного інтелекту із закритим вихідним кодом. Найвідомішими серед них є o3 від OpenAI, Gemini Pro 2.5 від Google та Claude 3.7 від Anthropic.

Наразі найсучасніша модель OpenAI, що підтримується Microsoft, o3-mini high, очолює загальний рейтинг моделей штучного інтелекту в усьому світі.

Джерело: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html