Vietnam.vn - Nền tảng quảng bá Việt Nam

Более мощная серия искусственного интеллекта из Китая

Модель может конкурировать с сильными конкурентами по всему миру, что свидетельствует о растущем технологическом потенциале страны с миллиардным населением.

Zing NewsZing News29/04/2025

Qwen3 — новая технология, представленная Alibaba. Фото: Рейтер .

28 апреля китайский технологический гигант Alibaba запустил серию моделей искусственного интеллекта под названием Qwen3. Компания утверждает, что этот чат-бот может сравниться или даже превзойти лучшие современные модели от OpenAI или Google в некоторых случаях.

При размере до 235 миллиардов параметров Qwen3 имеет производительность, сопоставимую с DeepSeek-V2 и OpenAI GPT-4, которые имеют около 236 миллиардов и 175 миллиардов параметров соответственно. Пользователи вскоре смогут загрузить его по открытой лицензии на платформе разработки искусственного интеллекта Hugging Face и Github, как только эта серия моделей будет выпущена.

Компания утверждает, что коллекция Qwen3 включает в себя гибридные модели, что означает, что они могут гибко распределять время, чтобы решать сложные проблемы или быстро реагировать на простые запросы. В этом случае способность делать выводы помогает модели самостоятельно проверять точность информации, но при этом возникает большая задержка.

Такая конструкция позволяет пользователям легко выделять соответствующий бюджет для каждой конкретной задачи. Кроме того, эта модель также учится у многих конкурентов по всему миру .

Используя ту же архитектуру «смешанных экспертов» (MoE), что и DeepSeek, Qwen3 может оптимизировать вычислительную эффективность, но при этом использовать лишь малую часть затрат на обучение. Это метод разбиения задачи на отдельные части и предоставления только тех подробных данных, которые необходимы для ее выполнения.

По словам команды разработчиков, Qwen3 поддерживает до 119 языков и обучается на наборе данных объемом около 36 триллионов токенов, что эквивалентно 27 триллионам слов. Данные для обучения берутся из многих источников, таких как учебники, наборы вопросов и ответов, программный код или генерируются искусственным интеллектом.

Эти улучшения, наряду со многими другими, значительно расширили возможности чат-бота по сравнению с его предшественником Qwen2. Techcrunch отмечает, что, хотя Qwen 3 и не превосходит последние топовые модели, такие как o3 или o4-mini от OpenAI, они все равно демонстрируют впечатляющую производительность.

Alibaba ra mat AI moi anh 1

Сравните результаты оценочных тестов. Фото: Qwen/X.

Qwen-3-235B-A22B, самая большая модель в коллекции, обошла OpenAI o3-mini и Google Gemini 2.5 Pro на Codeforces , популярной платформе для соревнований по программированию. Программное обеспечение также превзошло o3-mini в тестах сложности AIME и BFCL, которые оценивают способность модели к рассуждениям.

Qwen-3-235B-A22B пока официально не представлен публике. Тем временем пользователи могут загрузить Qwen3-32B. Модель превосходит OpenAI o1 в нескольких тестах, включая тест программирования LiveCodeBench.

По словам Alibaba, Qwen3 отличается превосходными характеристиками вызова инструментов, соблюдения инструкций и точного копирования форматов данных. Это элемент, которого не хватает многим другим инструментам. Исследования Университета Карнеги — Меллона показали, что многие ИИ фальсифицируют информацию и меняют форматы, несмотря на конкретные просьбы.

Помимо загрузки на вышеуказанных платформах, пользователи могут найти Qwen3 через поставщиков облачных сервисов, таких как Fireworks AI и Hyperbolic. Это позволяет крупным и малым предприятиям, а также отдельным разработчикам получать доступ и экспериментировать, невзирая на барьеры.

Появление некоторых китайских ИИ, таких как Qwen, усилило давление на исследовательские лаборатории США, подтолкнув их к разработке более мощных технологий. В результате политики страны ввели ограничения, чтобы ограничить доступ Китая к чипам.

Генеральный директор компании Baseten, предоставляющей услуги облачного хостинга ИИ, Тухин Шривастава отметил, что Qwen3 — это еще один пример того, как модель с открытым исходным кодом догоняет системы с закрытым исходным кодом, такие как OpenAI.

Qwen3, безусловно, по-прежнему будет широко использоваться внутри страны, несмотря на ограничения со стороны правительства США. «Это показывает, что китайские технологические компании могут не только полагаться на существующие модели, такие как Anthropic и OpenAI, но и разрабатывать собственное программное обеспечение», — сказал он.

Источник: https://znews.vn/them-loat-ai-manh-me-tu-trung-quoc-post1549756.html


Комментарий (0)

No data
No data

Та же категория

Дикая природа острова Катба
Долгое путешествие по Каменному плато
Кат Ба - Симфония лета
Найдите свой собственный Северо-Запад

Тот же автор

Наследство

Фигура

Бизнес

No videos available

Новости

Политическая система

Местный

Продукт