![]() |
DeepSeek använder enligt uppgift fortfarande Nvidia-chip, som är förbjudna att sälja i Kina, för att utveckla sin kommande AI-modell. Foto: Bloomberg . |
Enligt en ny rapport från The Information har den kinesiska AI-startupen DeepSeek använt Nvidia-chip, som är förbjudna att sälja i landet, för att utveckla sin kommande AI-modell.
Mer specifikt uppgav rapporten, som hänvisade till anonyma källor, att Nvidias mest avancerade Blackwell-chip smugglades in i Kina genom länder som hade tillstånd att sälja dem. Dessutom demonterades servrarna som innehöll dessa chips innan de anlände till Kina.
Försöket att smuggla Blackwell-chip, en ledande amerikansk AI-teknik, för modellutveckling visar den kinesiska AI-industrins starka beroende av amerikansk hårdvara.
Trots betydande investeringar från den kinesiska regeringen i chiptillverkning är inhemska alternativ fortfarande inte tillräckligt konkurrenskraftiga med Nvidias bästa produkter på den globala marknaden.
Deepseek har just presenterat sin DeepseekMath-V2-modell, som har uppnått guldmedaljvinnande resultat i ett antal prestigefyllda matematiktävlingar. Detta drag placerar det kinesiska företaget i direkt konkurrens med ledande amerikanska AI-labb, som ligger i framkant när det gäller språkliga modellerings- och resonemangskapaciteter.
Enligt teknisk dokumentation uppnådde DeepseekMath-V2 guldmedaljresultat vid den internationella matematiska olympiaden (IMO) 2025 och den kinesiska CMO-tävlingen 2024. I Putnam-tävlingen fick modellen 118 av 120 poäng, vilket vida överträffade 90-poängsgränsen som uppnåtts av den högst poängsatta mänskliga tävlande i historien. Dessa resultat visar dess förmåga att hantera komplexa problem.
Det kinesiska företaget förklarade att begränsningen med tidigare AI-modeller låg i att de visserligen kunde ge korrekta svar, men inte presentera en giltig lösning.
För att övervinna detta använder DeepseekMath-V2 en flerstegsprocess som inkluderar utvärdering av korrekthet, kontroll av motargument och tillhandahållande av ett slutgiltigt resultat. Denna driftsmetod gör det möjligt för systemet att självgranska och förfina lösningen i realtid, vilket undviker situationer där slutsatsen är korrekt men resonemanget är bristfälligt.
Det är värt att notera att Deepseeks dokumentation inte nämner användningen av externa verktyg som datorer eller kodtolkar i modellen. Testuppställningen visar att alla resultat genererades helt och hållet i naturligt språk.
Källa: https://znews.vn/deepseek-bi-to-post1610172.html







Kommentar (0)