DeepSeek spouští nástroj umělé inteligence schopný získat zlatou medaili v mezinárodní matematické soutěži

Řešení složitých problémů pomocí přirozeného jazyka, řešení a jasných, souvislých argumentů... není snadné, a to ani pro studenty, kteří jsou dobří v matematice. Společnost DeepSeek však vytvořila model umělé inteligence DeepSeekMath-V2, který je toho schopen.

DeepSeek ra mắt công cụ AI có khả năng giành HCV kỳ thi toán quốc tế - 1 — Společnost DeepSeek zaujala při vytváření modelu umělé inteligence schopného řešit problémy na úrovni mezinárodních zkoušek (ilustrace: AI).

V hodnocení dosáhl DeepSeekMath-V2 skóre na úrovni zlaté medaile v řešení úloh na Mezinárodní matematické olympiádě (IMO) 2025 a Čínské matematické olympiádě (CMO) 2024.

V testu IMO-ProofBench, který hodnotil schopnosti modelů umělé inteligence v oblasti matematické interpretace a uvažování, dosáhl DeepSeekMath-V2 vynikajícího skóre ve srovnání s jinými modely umělé inteligence, jako je DeepMind od Google, Grok od xAI nebo GPT-5 od OpenAI...

Je pozoruhodné, že model umělé inteligence DeepSeek dosáhl v roce 2024 při řešení Putnamovy matematické soutěže také skóre 118/120, zatímco nejvýše umístěný účastník v této soutěži dosáhl pouze 90 bodů. Putnamova soutěž je považována za nejtěžší a nejprestižnější matematickou soutěž pro univerzitní studenty na světě a koná se každý prosinec.

Mnoho problémů v mezinárodních soutěžích někdy nevyžaduje přesnou číselnou odpověď, místo toho je skóre založeno na uvažování použitém k nalezení řešení. DeepSeekMath-V2 však stále ukazuje schopnost přesně uvažovat v přirozeném jazyce stejně jako lidé, což tomuto modelu umělé inteligence pomáhá dosáhnout vysokého skóre.

Společnost DeepSeek uvádí, že aby pomohla svému modelu umělé inteligence přijít s přesnými odpověďmi a silnými argumenty, vytvořila dva velké jazykové modely a postavila je proti sobě. Jeden model funguje jako „dokazovatel“ a generuje matematické argumenty a důkazy, zatímco druhý model funguje jako „soudce“, který ověřuje předložené argumenty.

Tento způsob práce pomáhá eliminovat slabé hypotézy a argumenty, přičemž se zaměřuje na optimalizaci řešení pro nalezení správné odpovědi a na pevnou argumentaci.

DeepSeekMath-V2 je vyvíjen jako open source, což umožňuje komunitě upravovat zdrojový kód a používat ho k různým účelům.

Společnost DeepSeek tvrdí, že průlomy dosažené s DeepSeekMath-V2 položí základy pro budování výkonnějších a spolehlivějších matematických systémů umělé inteligence.

DeepSeek je čínská technologická společnost, která vzbudila celosvětový rozruch, když koncem ledna uvedla na trh model AI R1, který nabízí rychlou a přesnou odezvu.

Vrcholem R1 je, že DeepSeek utratil za vývoj a trénování tohoto modelu umělé inteligence pouze přibližně 6,5 milionu USD, namísto toho, aby musel utratit miliardy USD jako americké technologické společnosti za trénování a provoz vlastních modelů umělé inteligence.

Kromě toho byl R1 vyvinut a provozován společností DeepSeek na základě starší generace čipů umělé inteligence, protože čínské společnosti, na které je uvaleno embargo ze strany americké vlády , si nemohou objednávat špičkové čipy umělé inteligence. R1 však stále vykazuje působivé výpočetní schopnosti a rychlost reakce na požadavky uživatelů.

Vznik DeepSeeku způsobil, že USA ztratily monopol v závodě o vývoj modelů umělé inteligence a zároveň zahájily nový závod. Technologické společnosti se místo zaměření pouze na inteligenci a výpočetní schopnosti začaly více zaměřovat na problém ekonomické efektivity v procesu vývoje modelů umělé inteligence.

Zdroj: https://dantri.com.vn/cong-nghe/deepseek-ra-mat-cong-cu-ai-co-kha-nang-gianh-hcv-ky-thi-toan-quoc-te-20251130154751624.htm