DeepSeek breekt records

Het DeepseekMath-V2-model levert indrukwekkende prestaties bij het oplossen van wiskundige problemen. Foto: Decoder .

Deepseek heeft zojuist zijn DeepseekMath-V2-model aangekondigd, dat gouden medailles heeft behaald bij een reeks prestigieuze wiskundewedstrijden. Met deze stap concurreert het Chinese bedrijf rechtstreeks met toonaangevende Amerikaanse AI-labs, die toonaangevend zijn op het gebied van redeneren met taalmodellen.

Volgens de technische documentatie behaalde DeepseekMath-V2 gouden medailles op de Internationale Wiskunde Olympiade (IMO) van 2025 en de China CMO van 2024. Bij het Putnam-examen scoorde het model 118 van de 120 punten, ruim boven de 90 punten van de hoogst scorende menselijke deelnemer ooit. Deze resultaten getuigen van zijn vermogen om complexe problemen aan te pakken.

Het Chinese bedrijf legde uit dat de beperking van eerdere AI-modellen was dat ze weliswaar correcte antwoorden konden geven, maar geen geldige oplossingen konden presenteren. Om dit te verhelpen, gebruikt DeepseekMath-V2 een meerfasenproces dat bestaat uit het beoordelen van de correctheid, het controleren op tegenargumenten en het presenteren van het eindresultaat. Deze werkwijze stelt het systeem in staat om oplossingen in realtime te beoordelen en te verfijnen, waardoor de situatie van correcte conclusies maar onjuiste redeneringen wordt vermeden.

Opvallend is dat de documentatie van Deepseek geen melding maakt van het gebruik van externe tools zoals computers of interpreters voor het model. De testopstelling laat zien dat alle resultaten volledig in natuurlijke taal worden gegenereerd.

Deepseek benadrukt dat de prestatieverbetering voortkomt uit het vermogen om zelfkritiek te leveren en oplossingen zelf te corrigeren, zonder afhankelijk te zijn van gespecialiseerde wiskundige software. Bij moeilijke problemen schaalt het systeem de berekening op door meerdere oplossingen parallel te genereren, waardoor de betrouwbaarheid van het eindresultaat toeneemt.

De komst van DeepseekMath-V2 komt kort nadat OpenAI en Google DeepMind aankondigden dat hun ongepubliceerde modellen ook gouden medailles wonnen op de IMO, een prestatie die voorheen buiten de mogelijkheden van grote taalmodellen lag. De informatie over deze systemen is momenteel echter zeer beperkt, behalve dat een OpenAI-onderzoeker heeft aangegeven dat er in de komende maanden een wiskundig krachtigere versie beschikbaar zal zijn.

In tegenstelling tot de geheimzinnigheid van Amerikaanse bedrijven heeft Deepseek ervoor gekozen om details over zijn methoden en technische architectuur openbaar te maken. Deze aanpak stelt het bedrijf in staat om transparantie te tonen en tegelijkertijd concurrentiedruk te creëren op het Amerikaanse AI-ecosysteem. Volgens The Economist hebben sommige Amerikaanse startups overwogen om over te stappen op het goedkope open-sourcemodel uit China om kosten te besparen.

Bron: https://znews.vn/deepseek-pha-ky-luc-post1606990.html