Модель Qwen-3-Max-Preview має понад один трильйон параметрів. Фото: Reuters . |
Alibaba Group Holding щойно випустила найбільшу на сьогодні модель штучного інтелекту компанії, що знаменує собою новий крок вперед у світовій гонці ШІ. Ця модель під назвою Qwen-3-Max-Preview стала першою моделлю китайської технологічної групи, яка подолала поріг в один трильйон параметрів, поставивши Alibaba в ряди таких «гігантів», як OpenAI, Google DeepMind або Anthropic.
Нова модель, випущена 5 вересня, тепер доступна на хмарній платформі Alibaba Cloud та на головному ринку мовних моделей OpenRouter. Qwen-3-Max-Preview є продовженням серії Qwen3, яка вперше була представлена у травні з версіями від 600 мільйонів до 235 мільярдів параметрів.
У штучному інтелекті параметри вважаються «інтелектом» системи, змінними, які коригуються під час навчання. Більша кількість параметрів зазвичай означає потужніші можливості, але також вимагає величезної обчислювальної потужності. Для порівняння, GPT-4.5 від OpenAI, одна з найбільших моделей на сьогодні, за оцінками, має 5-7 трильйонів параметрів.
Згідно з оголошенням, Qwen-3-Max-Preview — це модель обробки тексту, яка перевершує Qwen3-235B-A22B-2507. У внутрішніх тестах Qwen-3-Max-Preview перевершує Kimi K2 від MoonShot AI, версію Claude Opus 4 без логічного висновку, та DeepSeek V3.1, який підтримує форматування Anthropic. Однак ці бенчмарки не були включені до офіційного технічного звіту.
«Qwen-3-Max-Preview демонструє значні покращення загальних можливостей, починаючи від розуміння китайського та англійського тексту, виконання складних інструкцій, обробки суб’єктивних завдань, підтримки кількох мов та використання інструментів. Розширення все ще триває, і офіційний реліз принесе більше сюрпризів», – йдеться у заяві Alibaba.
Протягом багатьох років Qwen допоміг Alibaba виділитися у світовій екосистемі штучного інтелекту з відкритим кодом. Ці моделі досягли понад 20 мільйонів завантажень та згенерували 100 000 похідних моделей на платформі Hugging Face. Однак Qwen-3-Max-Preview не має відкритого коду. Користувачі можуть отримати до нього доступ лише через Alibaba Cloud або OpenRouter, подібно до Qwen2.5-Max.
У соціальних мережах Біньюань Хуей, інженер зі штучного інтелекту в Alibaba, повідомив, що версія моделі для «логічного мислення» все ще перебуває в розробці.
Вартість доступу до Qwen-3-Max-Preview на Alibaba Cloud також є однією з найвищих у сімействі Qwen. Початкова ціна становить $0,861 за мільйон вхідних токенів та $3,441 за мільйон вихідних токенів. Тим часом версія Qwen3-235B-A22B-2507 коштує лише $0,287 за мільйон вхідних токенів та $1,147 за вихідний.
Джерело: https://znews.vn/alibaba-cong-bo-mo-hinh-thach-thuc-openai-post1583459.html
Коментар (0)