Qwen3 — новая технология, запущенная Alibaba. Фото: SCMP . |
Согласно последним тестам в области искусственного интеллекта, недавно выпущенная Alibaba модель искусственного интеллекта Qwen3 превзошла DeepSeek R1 и стала самой высокорейтинговой в мире моделью с открытым исходным кодом.
В частности, данные LiveBench, независимой платформы, которая тестирует большие языковые модели (LLM), технологию, лежащую в основе сервисов генеративного ИИ, таких как ChatGPT, показывают, что Qwen3 превзошел R1 в тестах.
Обзор возможностей моделей ИИ с открытым исходным кодом включает программирование, математику, анализ данных и обучение языку.
28 апреля Alibaba выпустила серию ИИ-моделей под названием Qwen3. Компания утверждает, что этот чат-бот может сравниться с лучшими в настоящее время моделями OpenAI или Google, а в некоторых случаях даже превзойти их.
Qwen3, имеющий объём до 235 миллиардов параметров, сопоставим с DeepSeek-V2 и OpenAI GPT-4, которые имеют около 236 и 175 миллиардов параметров соответственно. Пользователи вскоре смогут загрузить Qwen3 по открытой лицензии на платформе разработки ИИ Hugging Face и Github после выхода серии моделей.
Компания заявляет, что коллекция Qwen3 включает гибридные модели, что позволяет им гибко распределять время для решения сложных задач или быстрого реагирования на простые запросы. В этом случае вывод позволяет модели самостоятельно проверять точность информации, но при этом возникают высокие задержки.
Такая конструкция позволяет пользователям легко выделять соответствующий бюджет для каждой конкретной задачи. Кроме того, эта модель учитывает опыт многих конкурентов по всему миру.
Используя архитектуру «смешанных экспертов» (MoE), аналогичную DeepSeek, Qwen3 может максимизировать вычислительную эффективность при минимальной стоимости обучения. Этот подход разбивает задачу на отдельные части и рекомендует только те данные, которые необходимы для выполнения.
По словам команды разработчиков, Qwen3 поддерживает до 119 языков и обучается на наборе данных, состоящем почти из 36 000 миллиардов токенов, что эквивалентно 27 000 миллиардов слов. Данные для обучения берутся из множества источников, таких как учебники, наборы вопросов и ответов, программный код или самогенерируемый искусственный интеллект.
Несмотря на то, что Qwen3 возглавляет рейтинги ПО с открытым исходным кодом, обширное тестирование LiveBench показывает, что он отстает от ведущих в мире моделей ИИ с закрытым исходным кодом, в частности, o3 от OpenAI, Gemini Pro 2.5 от Google и Claude 3.7 от Anthropic.
В настоящее время флагманская модель OpenAI, поддерживаемая Microsoft, o3-mini High, занимает лидирующие позиции в общем рейтинге моделей ИИ в мире.
Источник: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html










Комментарий (0)