Эта новая модель не только бросает вызов доминированию американских гигантов, но и полностью меняет правила игры благодаря открытому исходному коду (Иллюстрация: DS).
Модель имеет 685 миллиардов параметров и распространяется под лицензией с открытым исходным кодом. Результаты первоначального тестирования показывают, что ее производительность сопоставима с проприетарными системами от OpenAI или Anthropic и открывает новый подход к разработке и распространению передовых моделей искусственного интеллекта.
Производительность и стоимость
Вскоре после выхода на платформе Hugging Face, DeepSeek V3.1 набрал 71,6% в тесте программирования Aider. Технически, модель способна обрабатывать контексты до 128 000 токенов (что эквивалентно книге объемом около 400 страниц). Архитектура представлена как «гибридная», объединяющая функции диалога, рассуждения и программирования.
«DeepSeek V3.1 показал результат 71,6% на Aider, что примерно на 1% лучше, чем у Claude Opus 4, при значительно меньших затратах», — заявил исследователь в области искусственного интеллекта Эндрю Кристиансон в социальной сети X.
По оценкам, средняя стоимость выполнения задачи программирования с использованием версии 3.1 составляет около 1,01 доллара, в то время как аналогичные системы могут стоить около 70 долларов.
Некоторые разработчики из сообщества также отметили наличие в архитектуре четырех «специальных токенов», которые позволяют модели интегрировать поиск в интернете в реальном времени и обрабатывать сложные процессы вывода.
Эта разница позволяет компаниям, обрабатывающим тысячи взаимодействий с искусственным интеллектом каждый день, сэкономить миллионы долларов.
Преимущества, меняющие правила игры
Выпуск версии 3.1 состоялся всего через несколько недель после того, как OpenAI и Anthropic анонсировали новые модели. Выбрав подход с открытым исходным кодом, DeepSeek следует иной стратегии, чем многие американские компании, которые коммерциализируют модели ИИ через платные API.
Некоторые утверждают, что широкое распространение передовых возможностей позволит организациям и предприятиям быстрее внедрять новые технологии, а также бросит вызов бизнес-моделям, основанным на технологических монополиях.
Появление DeepSeek V3.1 показывает, что передовые технологии искусственного интеллекта — это не только прерогатива крупных корпораций, но и небольших исследовательских групп.
Конкуренция в этой сфере уже не ограничивается созданием самой мощной системы, а также включает в себя обеспечение доступности и приемлемой стоимости технологий.
В этом контексте перед технологическими компаниями встает вопрос о том, как сохранить коммерческую ценность в условиях появления все большего числа моделей с открытым исходным кодом, обладающих конкурентоспособными характеристиками и стоимостью.
Источник: https://dantri.com.vn/cong-nghe/deepseek-am-tham-ra-phien-ban-ai-moi-20250820121017977.htm






Комментарий (0)