![]() |
DeepSeek bruker angivelig fortsatt Nvidia-brikker, som er forbudt å selge i Kina, for å utvikle sin kommende AI-modell. Foto: Bloomberg . |
Ifølge en ny rapport fra The Information har den kinesiske AI-oppstartsbedriften DeepSeek brukt Nvidia-brikker, som er forbudt å selge i landet, til å utvikle sin kommende AI-modell.
Mer spesifikt hevdet rapporten, som siterte anonyme kilder, at Nvidias mest avanserte Blackwell-brikker ble smuglet inn i Kina gjennom land som var autorisert til å selge dem. Videre ble serverne som inneholdt disse brikkene til og med demontert før de ankom Kina.
Forsøket på å smugle Blackwell-brikker, en ledende amerikansk AI-teknologi, til modellutvikling demonstrerer den kinesiske AI-industriens store avhengighet av amerikansk maskinvare.
Til tross for betydelige investeringer fra den kinesiske regjeringen i chipproduksjon, er innenlandske alternativer fortsatt ikke konkurransedyktige nok med Nvidias beste produkter på det globale markedet.
Deepseek har nettopp annonsert sin DeepseekMath-V2-modell, som har oppnådd gullmedaljevinnende resultater i en rekke prestisjetunge matematikkonkurranser. Dette trekket plasserer det kinesiske selskapet i direkte konkurranse med ledende amerikanske AI-laboratorier, som er i forkant av språklige modellerings- og resonneringsevner.
I følge teknisk dokumentasjon oppnådde DeepseekMath-V2 gullmedaljeresultater ved den internasjonale matematiske olympiaden (IMO) i 2025 og den kinesiske CMO-konkurransen i 2024. I Putnam-konkurransen scoret modellen 118 av 120 poeng, og overgikk dermed 90-poengsgrensen som ble oppnådd av den menneskelige deltakeren med høyest poengsum i historien. Disse resultatene demonstrerer dens evne til å håndtere komplekse problemer.
Det kinesiske selskapet forklarte at begrensningen ved tidligere AI-modeller lå i at selv om de kunne gi riktige svar, kunne de ikke presentere en gyldig løsning.
For å overvinne dette bruker DeepseekMath-V2 en flertrinnsprosess som inkluderer evaluering av korrekthet, kontroll av motargumenter og å gi et endelig resultat. Denne operasjonsmetoden lar systemet selvevaluere og forbedre løsningen i sanntid, og unngår situasjoner der konklusjonen er riktig, men resonnementet er feilaktig.
Det er verdt å merke seg at Deepseeks dokumentasjon ikke nevner bruken av eksterne verktøy som datamaskiner eller kodetolkere i modellen. Testoppsettet viser at alle resultatene ble generert utelukkende i naturlig språk.
Kilde: https://znews.vn/deepseek-bi-to-post1610172.html







Kommentar (0)