Qwen3, нова технологія, запущена Alibaba. Фото: SCMP . |
Згідно з останніми тестами бенчмарків у світі штучного інтелекту, нещодавно випущена модель штучного інтелекту Qwen3 від Alibaba перевершила R1 від DeepSeek, ставши найвище оціненою моделлю з відкритим кодом у світі .
Зокрема, дані LiveBench, незалежної платформи, яка проводить порівняльний аналіз моделей великих мов програмування (LLM), технології, що лежить в основі генеративних сервісів штучного інтелекту, таких як ChatGPT, показують, що Qwen3 перевершив R1 у тестах.
Огляд можливостей моделей штучного інтелекту з відкритим кодом включає програмування, математику, аналіз даних та навчання мовам.
Серію моделей штучного інтелекту під назвою Qwen3 компанія Alibaba випустила 28 квітня. Компанія стверджує, що цей чат-бот може бути порівнянним, а в деяких випадках навіть перевершити найкращі моделі, доступні наразі від OpenAI або Google.
Маючи розмір до 235 мільярдів параметрів, Qwen3 знаходиться на одному рівні з DeepSeek-V2 та OpenAI GPT-4, які мають близько 236 мільярдів та 175 мільярдів параметрів відповідно. Користувачі незабаром зможуть завантажити його за відкритою ліцензією на платформі розробки штучного інтелекту Hugging Face та Github після виходу серії моделей.
Компанія стверджує, що колекція Qwen3 включає гібридні моделі, що означає, що вони можуть гнучко розподіляти свій час для логічного висновку для вирішення складних проблем або швидкого реагування на прості запити. У цьому випадку логічний висновок дозволяє моделі самостійно перевіряти точність інформації, але спричиняє високу затримку.
Такий дизайн дозволяє користувачам легко розподіляти відповідний бюджет для кожного конкретного завдання. Крім того, ця модель також вчиться у багатьох конкурентів по всьому світу.
Використовуючи архітектуру «суміші експертів» (MoE), подібну до DeepSeek, Qwen3 може максимізувати обчислювальну ефективність за частку вартості навчання. Це підхід, який розбиває завдання на окремі частини та рекомендує лише достатню кількість глибоких даних для виконання.
За словами команди розробників, Qwen3 підтримує до 119 мов і навчається на наборі даних майже з 36 000 мільярдів токенів, що еквівалентно 27 000 мільярдам слів. Дані для навчання взяті з багатьох джерел, таких як підручники, набори питань і відповідей, програмний код або самостійно згенерований штучний інтелект...
Незважаючи на те, що Qwen3 очолює рейтинги відкритого коду, ретельне тестування LiveBench показує, що він відстає від провідних світових моделей штучного інтелекту із закритим кодом, зокрема від o3 від OpenAI, Gemini Pro 2.5 від Google та Claude 3.7 від Anthropic.
Наразі, o3-mini high, найкраща модель OpenAI, що підтримується Microsoft, очолює загальний рейтинг моделей штучного інтелекту у світі.
Джерело: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html










Коментар (0)