Alibaba запускает языковую модель, чтобы конкурировать с GPT-4o и DeepSeek V3

Эта модель искусственного интеллекта Alibaba построена на архитектуре Mixture-of-Experts (MoE) и обучена на более чем 20 триллионах токенов. По словам разработчиков, Qwen2.5-Max продемонстрировал «значительный прогресс в интеллектуальных возможностях» и теперь готов к использованию.

Alibaba ra mắt mô hình ngôn ngữ cạnh tranh với GPT-4o và DeepSeek V3- Ảnh 1. — Первые результаты показывают, что Qwen2.5-Max мощнее своих конкурентов.

Qwen2.5-Max не только повышает производительность и точность, но и лучше справляется с задачами, требующими глубокого понимания контекста, такими как анализ текста, перевод и создание контента. «Qwen2.5-Max демонстрирует значительный прогресс в обработке сложных запросов и предоставлении релевантных ответов», — говорится в сообщении Alibaba в блоге.

Впечатляющие цифры новой модели Alibaba

Модель Qwen2.5-Max была протестирована на многих важных бенчмарках, включая MMLU-Pro, LiveCodeBench, LiveBench и Arena-Hard. Результаты показывают, что Qwen2.5-Max превосходит DeepSeek V3 в таких тестах, как Arena-Hard, LiveBench и LiveCodeBench, и показывает конкурентоспособные результаты в MMLU-Pro. По сравнению с другими ведущими моделями, такими как GPT-4o и Claude-3.5-Sonnet, Qwen2.5-Max также подтверждает свою лидирующую позицию.

Alibaba Cloud планирует интегрировать Qwen2.5-Max в свои облачные сервисы, чтобы помочь клиентам решать самые разные проблемы: от автоматизации обработки данных до улучшения взаимодействия с клиентами с помощью чат-ботов и оптимизации бизнес-процессов. Модель ИИ теперь доступна через сервис Qwen Chat, позволяя пользователям взаимодействовать, тестировать ее возможности и экспериментировать с различными функциями. Кроме того, API также открыт для разработчиков. Чтобы получить к нему доступ, пользователям необходимо зарегистрироваться в Alibaba Cloud, активировать сервис Model Studio и создать ключ API.

Источник: https://thanhnien.vn/alibaba-ra-mat-mo-hinh-ngon-ngu-canh-tranh-voi-gpt-4o-va-deepseek-v3-185250129152256505.htm