Компания DeepSeek лишилась своего лидера.

Модель искусственного интеллекта Qwen3 от Alibaba успешно прошла тест R1 в LiveBench, которые оценивают возможности моделей с открытым исходным кодом в области программирования, математики и анализа данных.

ZNews•06/05/2025

Qwen3 — новая технология, запущенная компанией Alibaba. Фото: SCMP .

Согласно последним тестам производительности ИИ, недавно выпущенная компанией Alibaba модель искусственного интеллекта Qwen3 превзошла показатель R1 от DeepSeek и стала самой высокорейтинговой моделью с открытым исходным кодом в мире .

В частности, данные с LiveBench, независимой платформы, оценивающей большие языковые модели (LLM), являющиеся основополагающей технологией для сервисов генеративного ИИ, таких как ChatGPT, показывают, что Qwen3 превзошла показатель R1 в тестах.

Оценка возможностей моделей искусственного интеллекта с открытым исходным кодом включает программирование, математику, анализ данных и обучение языкам.

28 апреля Alibaba выпустила серию моделей искусственного интеллекта Qwen3. Компания утверждает, что этот чат-бот может конкурировать, а в некоторых случаях даже превосходить лучшие современные модели от OpenAI или Google.

Qwen3, обладающий размером до 235 миллиардов параметров, демонстрирует производительность, сравнимую с DeepSeek-V2 и OpenAI GPT-4, которые имеют приблизительно 236 миллиардов и 175 миллиардов параметров соответственно. Пользователи вскоре смогут загрузить его под открытой лицензией на платформу разработки ИИ Hugging Face и Github после выхода этой серии моделей.

Компания заявила, что в коллекцию Qwen3 входят гибридные модели, то есть они позволяют гибко распределять время на рассуждения для решения сложных задач или быстро реагировать на простые запросы. В этой модели возможность рассуждений позволяет самостоятельно проверять точность информации, но это происходит со значительной задержкой.

Такая конструкция позволяет пользователям легко распределять бюджет в соответствии с конкретными задачами. Кроме того, эта модель также учитывает опыт многих конкурентов по всему миру.

Используя архитектуру «смешанных экспертов» (MoE), аналогичную DeepSeek, Qwen3 может оптимизировать вычислительную производительность, затрачивая при этом лишь малую часть средств на обучение. Этот метод разбивает задачи на множество отдельных частей и требует лишь достаточного количества данных для их выполнения.

По словам команды разработчиков, Qwen3 поддерживает до 119 языков и обучается на наборе данных, содержащем почти 36 триллионов токенов, что эквивалентно 27 триллионам слов. Данные для обучения берутся из различных источников, таких как учебники, наборы вопросов и ответов, программный код или даже данные, сгенерированные ИИ и т. д.

Несмотря на то, что Qwen3 занимает лидирующие позиции в рейтинге открытых программ, расширенный тест производительности LiveBench показывает, что она по-прежнему отстает от ведущих мировых моделей искусственного интеллекта с закрытым исходным кодом. Наиболее заметными среди них являются o3 от OpenAI, Gemini Pro 2.5 от Google и Claude 3.7 от Anthropic.

В настоящее время самая передовая модель OpenAI, поддерживаемая Microsoft, o3-mini high, занимает первое место в общем рейтинге моделей ИИ во всем мире.

Источник: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html