A DeepSeek mesterséges intelligenciával működő eszközzel aranyérmet nyerhet egy nemzetközi matematikai versenyen.

A komplex problémák megoldása természetes nyelven, világos, összefüggő érvekkel... nem könnyű, még a jó matematikus diákok számára sem. A DeepSeek azonban létrehozott egy mesterséges intelligencia modellt, a DeepSeekMath-V2-t, amely képes erre.

DeepSeek ra mắt công cụ AI có khả năng giành HCV kỳ thi toán quốc tế - 1 — A DeepSeek lenyűgözött, amikor egy nemzetközi vizsgaszintű problémák megoldására képes MI-modellt alkotott (Illusztráció: MI).

A DeepSeekMath-V2 aranyérmes pontszámokat ért el a 2025-ös Nemzetközi Matematikai Olimpián (IMO) és a 2024-es Kínai Matematikai Olimpián (CMO) a feladatok megoldásában.

Amikor részt vettek az IMO-ProofBench teszten, amely a mesterséges intelligencia modelljeinek matematikai értelmezési és érvelési képességeit értékelte, a DeepSeek DeepSeekMath-V2 modellje kiemelkedő pontszámokat ért el más mesterséges intelligencia modellekhez, például a Google DeepMindhez, az xAI Grokjához vagy az OpenAI GPT-5-jéhez képest...

Figyelemre méltó, hogy a DeepSeek mesterséges intelligencia modellje a 2024-es Putnam matematikai versenyen 118/120 pontot ért el, míg a verseny legmagasabb rangú résztvevője mindössze 90 pontot ért el. A Putnam versenyt a világ legnehezebb és legrangosabb matematikai versenyének tartják egyetemi hallgatók számára, amelyet minden decemberben rendeznek meg.

A nemzetközi versenyeken számos probléma megoldása nem feltétlenül igényel pontos számszerű választ, ehelyett a pontszám a megoldáshoz használt érvelésen alapul. A DeepSeekMath-V2 azonban továbbra is képes az emberekhez hasonlóan szorosan, természetes nyelven érvelni, ami segíti ezt a mesterséges intelligencia modellt a magas pontszám elérésében.

A DeepSeek azt állítja, hogy a mesterséges intelligencia modelljének pontos válaszok és erős érvek felállításához két nagy nyelvi modellt épített, és egymással szembeállította őket. Az egyik modell „bizonyítóként” működik, matematikai érveket és bizonyításokat generál, míg a másik modell „bíróként” ellenőrzi a bemutatott érveket.

Ez a munkamódszer segít kiküszöbölni a gyenge hipotéziseket és érveket, a megoldás optimalizálására összpontosítva a helyes válasz megtalálása és a szoros érvelés érdekében.

A DeepSeekMath-V2 nyílt forráskódúként lett fejlesztve, így a közösség módosíthatja a forráskódot és különféle célokra felhasználhatja azt.

A DeepSeek szerint a DeepSeekMath-V2-vel elért áttörések megalapozzák majd a hatékonyabb és megbízhatóbb matematikai mesterséges intelligencia rendszerek építését.

A DeepSeek egy kínai technológiai vállalat, amely világszerte nagy feltűnést keltett, amikor január végén piacra dobta az AI R1 modellt, amely gyors és pontos válaszidőt biztosított.

Az R1 kiemelkedő tulajdonsága, hogy a DeepSeek mindössze körülbelül 6,5 millió USD-t költött ennek a mesterséges intelligencia modellnek a fejlesztésére és betanítására, ahelyett, hogy az amerikai technológiai vállalatokhoz hasonlóan több milliárd USD-t kellett volna költenie saját mesterséges intelligencia modelljeik betanítására és üzemeltetésére.

Ráadásul az R1-et a DeepSeek fejlesztette és üzemeltette régi generációs mesterséges intelligencia chipek alapján, mivel az amerikai kormány embargója alatt álló kínai vállalatok nem rendelhetnek csúcskategóriás mesterséges intelligencia chipeket. Az R1 azonban továbbra is lenyűgöző feldolgozási képességet és a felhasználói kérésekre adott válaszok sebességét mutatja.

A DeepSeek megjelenése miatt az Egyesült Államok elvesztette monopolhelyzetét a mesterséges intelligencia modellek fejlesztéséért folyó versenyben, és egyúttal egy új verseny is megnyílt. Ahelyett, hogy csak az intelligenciára és a feldolgozási képességekre koncentrálnának, a technológiai vállalatok egyre nagyobb figyelmet kezdtek fordítani a gazdasági hatékonyság problémájára a mesterséges intelligencia modellek fejlesztése során.

Forrás: https://dantri.com.vn/cong-nghe/deepseek-ra-mat-cong-cu-ai-co-kha-nang-gianh-hcv-ky-thi-toan-quoc-te-20251130154751624.htm