![]() |
DeepSeek gebruikt naar verluidt nog steeds Nvidia-chips, die in China niet te koop zijn, voor de ontwikkeling van zijn toekomstige AI-model. Foto: Bloomberg . |
Volgens een nieuw rapport van The Information heeft de Chinese AI-startup DeepSeek Nvidia-chips gebruikt, die in het land verboden zijn, om zijn toekomstige AI-model te ontwikkelen.
Het rapport, dat zich baseert op anonieme bronnen, stelt specifiek dat Nvidia's meest geavanceerde Blackwell-chips China werden binnengesmokkeld via landen die bevoegd waren om ze te verkopen. Bovendien werden de servers waarin deze chips waren opgeslagen zelfs gedemonteerd voordat ze in China aankwamen.
De poging om Blackwell-chips, een toonaangevende Amerikaanse AI-technologie, te smokkelen voor modelontwikkeling, toont aan hoe sterk de Chinese AI-industrie afhankelijk is van Amerikaanse hardware.
Ondanks aanzienlijke investeringen van de Chinese overheid in de chipfabricage, zijn binnenlandse alternatieven nog steeds niet concurrerend genoeg met Nvidia's beste producten op de wereldmarkt.
Deepseek heeft zojuist zijn DeepseekMath-V2-model aangekondigd, dat gouden medailles heeft gewonnen in een aantal prestigieuze wiskundewedstrijden. Deze stap plaatst het Chinese bedrijf in directe concurrentie met toonaangevende Amerikaanse AI-laboratoria, die voorop lopen op het gebied van taalkundige modellering en redeneervermogen.
Volgens de technische documentatie behaalde DeepseekMath-V2 gouden medailles op de Internationale Wiskunde Olympiade (IMO) van 2025 en de Chinese CMO-competitie van 2024. In de Putnam-competitie behaalde het model 118 van de 120 punten, waarmee het de 90 punten van de hoogst scorende menselijke deelnemer ooit ruimschoots overtrof. Deze resultaten tonen aan dat het model complexe problemen aankan.
Het Chinese bedrijf legde uit dat de beperking van eerdere AI-modellen erin lag dat ze weliswaar correcte antwoorden konden geven, maar geen geldige oplossing konden bieden.
Om dit te ondervangen, gebruikt DeepseekMath-V2 een proces in meerdere stappen, waaronder het evalueren van de correctheid, het controleren van tegenargumenten en het leveren van een eindresultaat. Deze werkwijze stelt het systeem in staat om de oplossing in realtime zelf te controleren en te verfijnen, waardoor situaties worden vermeden waarin de conclusie correct is, maar de redenering gebrekkig.
Opvallend is dat de documentatie van Deepseek geen melding maakt van het gebruik van externe tools zoals computers of code-interpreters in het model. De testopstelling laat zien dat alle resultaten volledig in natuurlijke taal zijn gegenereerd.
Bron: https://znews.vn/deepseek-bi-to-post1610172.html







Reactie (0)