![]() |
Модель DeepseekMath-V2 досягає неймовірної продуктивності у вирішенні математичних задач. Зображення: Decoder . |
Компанія Deepseek щойно анонсувала свою модель DeepseekMath-V2, яка отримала золоті медалі на низці престижних математичних змагань. Цей крок ставить китайську компанію у пряму конкуренцію з провідними американськими лабораторіями штучного інтелекту, які є лідерами у сфері лінгвістичного моделювання та мислення.
Згідно з технічною документацією, DeepseekMath-V2 отримала золоті медалі на Міжнародній математичній олімпіаді (IMO) 2025 року та на китайському конкурсі CMO 2024 року. У конкурсі Патнема модель набрала 118 балів зі 120, що значно перевищує позначку в 90 балів, досягнуту учасником-людиною з найвищим балом в історії. Ці результати демонструють її здатність вирішувати складні задачі.
Китайська компанія пояснила, що обмеження попередніх моделей штучного інтелекту полягало в тому, що хоча вони могли надавати правильні відповіді, вони не могли представити коректне рішення. Щоб подолати це, DeepseekMath-V2 використовує багатоетапний процес, який включає оцінку правильності, перевірку аргументів та надання кінцевого результату. Цей метод роботи дозволяє системі самостійно перевіряти та уточнювати рішення в режимі реального часу, уникаючи ситуацій, коли висновок правильний, але міркування хибні.
Примітно, що в документації Deepseek не згадується використання в моделі зовнішніх інструментів, таких як комп'ютери чи інтерпретатори коду. Тестова схема показує, що всі результати були згенеровані повністю природною мовою.
Deepseek наголошує, що його продуктивність досягається завдяки самокритиці та самокорекції рішень, а не спираючись на спеціалізоване математичне програмне забезпечення. Для складних задач система масштабує обчислення, генеруючи кілька паралельних рішень, тим самим підвищуючи надійність кінцевого результату.
Поява DeepseekMath-V2 відбулася невдовзі після того, як OpenAI та Google DeepMind оголосили, що їхні раніше неопубліковані моделі також отримали золоті медалі на IMO. Це досягнення раніше виходило за межі можливостей великомасштабних мовних моделей. Однак інформація про ці системи наразі дуже обмежена, за винятком того, що дослідник OpenAI заявив, що потужніша математична версія з'явиться найближчими місяцями.
На відміну від секретності американських компаній, Deepseek вирішила публічно розкривати деталі своєї методології та технічної архітектури. Такий підхід демонструє прозорість, а також чинить конкурентний тиск на американську екосистему штучного інтелекту. За даними The Economist , деякі американські стартапи розглядали можливість переходу на дешевші моделі з відкритим кодом з Китаю, щоб заощадити кошти.
Джерело: https://znews.vn/deepseek-pha-ky-luc-post1606990.html







Коментар (0)