
DeepSeak разработала модель искусственного интеллекта, которая не только пишет код, но и проверяет его и подтверждает свою корректность.
DeepSeekMath-V2 установила беспрецедентные рекорды производительности, превзойдя человеческие достижения в серьёзных академических соревнованиях. В частности, модель завоевала золотую медаль на Международной математической олимпиаде (IMO) 2025 года и поразила всех, набрав 118/120 баллов на экзамене в Патнэме, что значительно превышает рекорд в 90 наивысших баллов, когда-либо достигнутых людьми.
Но что действительно делает эту модель новаторской, так это не оценка, а функция «самопроверки» DeepSeek.
Механизм самопроверки и исправления ошибок DeepSeek
На протяжении многих лет модели искусственного интеллекта (ИИ) и большие языковые модели (LLM) сталкивались с серьезным недостатком при решении задач, требующих абсолютной логики, таких как математика, а именно с феноменом «неправильного рассуждения, но правильного ответа».
То есть модель может случайным образом выдавать правильный окончательный ответ, но последовательность шагов вывода, формул или логических шагов, которые привели к этому результату, могут быть неверными, неполными или галлюцинаторными.
В области науки , техники и математики правильный ответ при неправильном решении не имеет абсолютно никакой ценности и значительно снижает надёжность системы искусственного интеллекта. DeepSeekMath-V2 был создан, чтобы положить конец этой эпохе ненадёжности.
Способность DeepSeekMath-V2 к самопроверке лежит в основе его успеха. Она действует как «внутренний аудитор» мыслительного процесса ИИ. Вместо того, чтобы просто сделать один вывод и выдать ответ, модель DeepSeekMath-V2 использует двусторонний механизм.
Первая — это роль доказательства, где модель генерирует начальную цепочку аргументов и решений. Затем модель автоматически запускает внутреннюю систему проверки, которая проверяет каждый логический шаг только что сгенерированной цепочки аргументов на наличие ошибок, несоответствий или необоснованных скачков.
Этот процесс очень похож на работу системы оценки IMO-ProofBench, где один ИИ генерирует аргумент, а другой его проверяет. Повторяя эту перекрёстную проверку до тех пор, пока цепочка аргументов не будет полностью подтверждена, DeepSeekMath-V2 гарантирует не только правильность ответа, но и абсолютную корректность и прозрачность пути к нему.
Открывая будущее надежного искусственного интеллекта
Результаты применения этого метода самопроверки могут установить новый стандарт прозрачности и надежности для реальных приложений ИИ.
В будущем эту модель можно будет применять и в других важных областях, таких как: ИИ не только пишет код, но и самостоятельно проверяет и доказывает его правильность, сводя к минимуму серьезные ошибки.
Кроме того, ИИ может автоматически проверять сложные цепочки рассуждений при разработке гипотез или доказательстве новых теорем, тем самым обеспечивая рациональность и безопасность важных решений, принимаемых ИИ.
Решение DeepSeek опубликовать исходный код модели на таких платформах, как Hugging Face и GitHub, является стратегическим шагом, позволяющим мировому исследовательскому сообществу получить доступ к этому проверяемому принципу вывода и использовать его в своих разработках.
DeepSeekMath-V2 представляет собой квантовый скачок вперёд, не только демонстрируя непревзойдённую способность ИИ решать самые сложные задачи, но и гарантируя, что эта способность основана на доверии и непоколебимой логике. Это доказывает, что следующее поколение ИИ будет не только умнее, но и честнее и прозрачнее в своём мыслительном процессе.
Источник: https://tuoitre.vn/deepseek-phat-trien-mo-hinh-co-kha-nang-tu-kiem-chung-cac-suy-luan-trong-toan-hoc-2025113016585069.htm






Комментарий (0)