DeepSeek utvecklar en matematisk AI-modell som kan självverifiera

Den 28 november tillkännagav det kinesiska företaget DeepSeek, som specialiserar sig på artificiell intelligens (AI), AI-modellen DeepSeekMath-V2, som anses vara ett genombrott inom matematiskt resonemang med AI, som sätter nya prestandastandarder och utökar gränserna för problemlösningsmöjligheter med hjälp av maskininlärning.

DeepSeekMath-V2:s källkod är allmänt tillgänglig på Hugging Face och GitHub.

Modellen integrerar ett självverifieringsramverk för att kontrollera giltigheten av en kedja av argument, utöver att generera korrekta svar, något som många nuvarande AI-modeller fortfarande kämpar med.

Utvärderingsresultaten visar att DeepSeekMath-V2 är kvalificerad för guldmedaljer vid den internationella matematikolympiaden (IMO) 2025 och den kinesiska matematikolympiaden (CMO) 2024.

Det är värt att notera att modellen fick 118/120 poäng i Putnam-provet 2024, vilket vida överträffade 90-poängsgränsen, det högsta rekordet som någonsin uppnåtts av människor.

Modellens logiska resonemangsförmåga testas med hjälp av IMO-ProofBench-systemet, ett dedikerat riktmärke som används för att verifiera AI-modellers resonemangsnoggrannhet.

DeepSeekMath-V2 uppvisar överlägsen prestanda jämfört med många andra toppmoderna modeller, inklusive DeepMinds DeepThink.

IMO-ProofBench fungerar med en mekanism för korskontroll: en modell tar på sig rollen att "bevisa", vilket genererar en kedja av matematiska argument, medan den andra modellen tar på sig rollen att "validera", vilket bedömer argumentets styrka.

Denna mekanism möjliggör upptäckt av fel i modellens tänkande, en inneboende svaghet hos moderna AI-system.

Enligt utvecklingsteamet hjälper DeepSeekMath-V2:s självverifierande metod till att lösa den största begränsningen med nuvarande AI-modeller: möjligheten att generera korrekta svar men baserat på felaktigt eller inkonsekvent resonemang.

DeepSeek anser att dessa framsteg visar att metoden med "självverifierande matematiskt resonemang" har potential att bli grunden för en mer kraftfull, pålitlig och transparent generation av matematisk AI i framtiden.

(TTXVN/Vietnam+)

Källa: https://www.vietnamplus.vn/deepseek-phat-trien-mo-hinh-ai-lap-luan-toan-hoc-co-kha-nang-tu-kiem-chung-post1079916.vnp