Ez az új modell nemcsak az amerikai óriások dominanciáját kérdőjelezi meg, hanem nyílt forráskóddal alakítja át az egész játékot (Illusztráció: DS).
A modell 685 milliárd paraméterrel rendelkezik, és nyílt forráskódú licenc alatt érhető el. A kezdeti teszteredmények azt mutatják, hogy teljesítménye vetekszik az OpenAI vagy az Anthropic saját rendszereivel, és új megközelítést nyit a fejlett MI-modellek fejlesztésében és terjesztésében.
Teljesítmény és költség
Röviddel a Hugging Face platformon való megjelenése után a DeepSeek V3.1 71,6%-os eredményt ért el az Aider programozási teszten. Technikailag a modell akár 128 000 token kontextusának kezelésére is képes (ami egy körülbelül 400 oldalas könyvnek felel meg). Az architektúrát „hibridként” mutatják be, amely integrálja a beszélgetési, az érvelési és a programozási funkciókat.
„A DeepSeek V3.1 71,6%-os eredményt ért el az Aideren, ami körülbelül 1%-kal jobb, mint a Claude Opus 4, miközben jelentősen kevesebbe került” – mondta Andrew Christianson, a mesterséges intelligencia kutatója az X közösségi oldalon.
A becslések szerint egy V3.1-es verzióval végzett programozási feladat átlagos költsége körülbelül 1,01 dollár, míg az ezzel egyenértékű rendszerek ára közelebb lehet a 70 dollárhoz.
Néhány közösségi fejlesztő négy „speciális token” jelenlétét is megjegyezte az architektúrában, amelyek lehetővé teszik a modell számára a valós idejű webes keresés integrálását és az összetett következtetési folyamatok kezelését.
Ez a különbség több millió dolláros megtakarítást jelent azoknak a vállalkozásoknak, amelyek naponta több ezer mesterséges intelligencia-interakciót kezelnek.
Játékmódosító előnyök
A V3.1 bevezetése mindössze néhány héttel azután történt, hogy az OpenAI és az Anthropic bejelentette az új modelleket. A nyílt forráskódú megközelítés választásával a DeepSeek más stratégiát követ, mint sok amerikai vállalat, amelyek fizetős API-kon keresztül értékesítik a mesterséges intelligencia modelljeiket.
Egyesek azzal érvelnek, hogy a fejlett képességek széles körű elérhetővé tétele lehetővé teheti a szervezetek és a vállalkozások számára a gyorsabb telepítést, miközben kihívást jelenthet a technológiai monopóliumokra épülő üzleti modellek számára is.
A DeepSeek V3.1 megjelenése azt mutatja, hogy a fejlett mesterséges intelligencia nemcsak a nagyvállalatok, hanem a kisebb kutatócsoportok felségterülete is.
A verseny ezen a téren már nem korlátozódik a legerősebb rendszer kiépítésére, hanem a technológia elérhetővé és megfizethetővé tételére is kiterjed.
Ebben az összefüggésben a technológiai vállalatok számára az a kérdés, hogyan őrizzék meg kereskedelmi értéküket, amikor egyre több nyílt forráskódú modell jelenik meg versenyképes teljesítménnyel és költséggel.
Forrás: https://dantri.com.vn/cong-nghe/deepseek-am-tham-ra-phien-ban-ai-moi-20250820121017977.htm






Hozzászólás (0)