![]() |
A DeepSeek állítólag továbbra is Nvidia chipeket használ, amelyek forgalmazása Kínában betiltva van, a közelgő mesterséges intelligencia modelljének fejlesztéséhez. Fotó: Bloomberg . |
A The Information új jelentése szerint a kínai mesterséges intelligencia startup, a DeepSeek, Nvidia chipeket használt, melyek forgalmazása betiltva van az országban, a közelgő mesterséges intelligencia modelljének fejlesztéséhez.
Konkrétan a névtelen forrásokra hivatkozó jelentés azt állította, hogy az Nvidia legfejlettebb Blackwell chipjeit csempészték be Kínába olyan országokon keresztül, amelyek jogosultak voltak azok értékesítésére. Ráadásul a chipeket tartalmazó szervereket még az érkezésük előtt szétszerelték.
A Blackwell chipek, egy vezető amerikai mesterséges intelligencia technológia modellfejlesztéshez való csempészésére tett kísérlet jól mutatja a kínai mesterséges intelligenciaipar amerikai hardverektől való nagymértékű függését.
Annak ellenére, hogy a kínai kormány jelentős beruházásokat eszközölt a chipgyártásban, a hazai alternatívák még mindig nem elég versenyképesek az Nvidia legjobb termékeivel a globális piacon.
A Deepseek nemrégiben jelentette be DeepseekMath-V2 modelljét, amely számos rangos matematikai versenyen aranyérmet nyert. Ez a lépés a kínai vállalatot közvetlen versenyre kényszeríti a vezető amerikai mesterséges intelligencia laboratóriumokkal, amelyek a nyelvi modellezési érvelési képességek élvonalában vannak.
A műszaki dokumentáció szerint a DeepseekMath-V2 aranyérmet ért el a 2025-ös Nemzetközi Matematikai Olimpián (IMO) és a 2024-es kínai CMO versenyen. A Putnam versenyen a modell 120 pontból 118-at ért el, amivel messze felülmúlta a történelem legmagasabb pontszámot elért emberi versenyzőjének 90 pontos határát. Ezek az eredmények bizonyítják, hogy képes komplex problémák kezelésére.
A kínai vállalat kifejtette, hogy a korábbi mesterséges intelligencia modellek korlátja abban rejlett, hogy bár helyes válaszokat tudtak adni, érvényes megoldást nem tudtak felmutatni.
Ennek kiküszöbölésére a DeepseekMath-V2 egy többlépcsős folyamatot használ, amely magában foglalja a helyesség értékelését, az ellenérvek ellenőrzését és a végeredmény megadását. Ez a működési módszer lehetővé teszi a rendszer számára, hogy valós időben ellenőrizze és finomítsa a megoldást, elkerülve azokat a helyzeteket, ahol a következtetés helyes, de az érvelés hibás.
Figyelemre méltó, hogy a Deepseek dokumentációja nem említi külső eszközök, például számítógépek vagy kódértelmezők használatát a modellben. A tesztbeállítás azt mutatja, hogy minden eredmény teljes egészében természetes nyelven generálódott.
Forrás: https://znews.vn/deepseek-bi-to-post1610172.html







Hozzászólás (0)