Решать сложные задачи, используя естественный язык, решения и ясные, последовательные аргументы... непросто даже для студентов, хорошо разбирающихся в математике. Однако компания DeepSeek создала модель искусственного интеллекта DeepSeekMath-V2, которая способна на это.

DeepSeek был впечатлен созданием модели ИИ, способной решать задачи уровня международных экзаменов (Иллюстрация: ИИ).
По результатам оценок DeepSeekMath-V2 показал результаты, соответствующие золотым медалям, за решение задач на Международной математической олимпиаде (IMO) 2025 года и Китайской математической олимпиаде (CMO) 2024 года.
При участии в тесте IMO-ProofBench по оценке возможностей математической интерпретации и рассуждений моделей ИИ, DeepSeekMath-V2 от DeepSeek показала выдающиеся результаты по сравнению с другими моделями ИИ, такими как Google DeepMind, xAI Grok или OpenAI GPT-5...
Примечательно, что модель искусственного интеллекта DeepSeek также набрала 118/120 при решении задач математического конкурса Патнэма в 2024 году, в то время как участник, занявший в этом конкурсе самый высокий рейтинг, набрал всего 90 баллов. Конкурс Патнэма считается самым сложным и престижным в мире математическим конкурсом для студентов университетов, который проводится каждый декабрь.
Многие задачи на международных соревнованиях иногда не требуют точного ответа, вместо этого оценка основывается на рассуждениях, использованных при поиске решения. Тем не менее, DeepSeekMath-V2 по-прежнему демонстрирует способность рассуждать на естественном языке, подобно человеку, что помогает этой модели искусственного интеллекта получать высокие баллы.
DeepSeek утверждает, что для того, чтобы помочь своей модели искусственного интеллекта выдавать точные ответы и убедительные аргументы, компания построила две большие языковые модели и сравнила их. Одна модель выступает в роли «доказательства», генерируя математические аргументы и доказательства, а другая — в роли «судьи», проверяя представленные аргументы.
Такой подход к работе помогает исключить слабые гипотезы и аргументы, концентрируясь на оптимизации решения для поиска правильного ответа и ведения жесткой аргументации.
DeepSeekMath-V2 разрабатывается с открытым исходным кодом, что позволяет сообществу изменять исходный код и использовать его в различных целях.
DeepSeek утверждает, что достижения DeepSeekMath-V2 заложат основу для создания более мощных и надежных систем математического ИИ.
DeepSeek — китайская технологическая компания, которая произвела фурор во всем мире, когда в конце января выпустила модель AI R1, обеспечивающую быструю и точную скорость реагирования.
Отличительной чертой R1 является то, что DeepSeek потратила всего около 6,5 миллионов долларов США на разработку и обучение этой модели ИИ, вместо того чтобы тратить миллиарды долларов США, как американские технологические компании, на обучение и эксплуатацию собственных моделей ИИ.
Кроме того, R1 был разработан и эксплуатируется компанией DeepSeek на основе ИИ-чипов старого поколения, поскольку китайские компании, находящиеся под эмбарго правительства США, не могут заказывать высокопроизводительные ИИ-чипы. Тем не менее, R1 по-прежнему демонстрирует впечатляющую вычислительную мощность и скорость реагирования на запросы пользователей.
Появление DeepSeek привело к потере США монополии в гонке за разработку моделей ИИ и одновременно открыло новую гонку. Вместо того чтобы концентрироваться исключительно на интеллектуальных и вычислительных возможностях, технологические компании стали уделять больше внимания проблеме экономической эффективности при разработке моделей ИИ.
Источник: https://dantri.com.vn/cong-nghe/deepseek-ra-mat-cong-cu-ai-co-kha-nang-gianh-hcv-ky-thi-toan-quoc-te-20251130154751624.htm






Комментарий (0)