Ez az új modell nemcsak az amerikai óriások dominanciáját kérdőjelezi meg, hanem nyílt forráskóddal alakítja át az egész játékot (Szemléltető kép: DS).
Ez a modell 685 milliárd paraméterrel rendelkezik, és nyílt forráskódú licenc alatt érhető el. A kezdeti teszteredmények az OpenAI vagy az Anthropic saját rendszereihez hasonló teljesítményt mutatnak, és új megközelítéseket nyit meg a fejlett MI-modellek fejlesztésében és terjesztésében.
Teljesítmény és költség
Közvetlenül a Hugging Face platformon való megjelenése után a DeepSeek V3.1 71,6%-os pontszámot ért el az Aider programozási teszten. Technikailag a modell akár 128 000 token (ami egy 400 oldalas könyvnek felel meg) kontextusát is képes kezelni. A struktúra „hibridként” jelenik meg, amely integrálja a chat, a következtetés és a programozási funkciókat.
Andrew Christianson mesterséges intelligencia kutató az X közösségi média platformon kijelentette: „A DeepSeek V3.1 71,6%-ot ért el az Aideren, ami körülbelül 1%-kal magasabb, mint a Claude Opus 4, miközben jelentősen kevesebbe került.”
Számítások szerint egy V3.1-es verzióval végzett programozási feladat átlagos költsége körülbelül 1,01 dollár, míg a hasonló rendszerek közel 70 dollárba kerülhetnek.
Néhány közösségi fejlesztő négy „speciális token” jelenlétét is megjegyezte az architektúrában, amelyek lehetővé teszik a modell számára a valós idejű webes keresés integrálását és az összetett következtetési folyamatok kezelését.
Ez a különbség több millió dolláros megtakarítást jelent azoknak a vállalkozásoknak, amelyek naponta több ezer mesterséges intelligencia-interakciót kezelnek.
Játékot megváltoztató előny
A V3.1 megjelenése egybeesett az OpenAI és az Anthropic új modelljeinek bejelentésével. A nyílt forráskódú megközelítés választásával a DeepSeek más stratégiát követett, mint sok amerikai vállalat, amelyek fizetős API-kon keresztül értékesítik a mesterséges intelligencia modelljeiket.
Egyesek azzal érvelnek, hogy a fejlett képességek széles körű elérhetősége elősegítheti a szervezetek és vállalkozások általi gyorsabb telepítést, miközben kihívást jelent a technológiai monopóliumokra épülő üzleti modellek számára is.
A DeepSeek V3.1 megjelenése azt mutatja, hogy a fejlett mesterséges intelligencia nem csak a nagyvállalatoknak szól, hanem kisebb kutatócsoportok is részt vehetnek benne.
A verseny ezen a területen már nem korlátozódik a legerősebb rendszer kiépítésére, hanem a technológia hozzáférhetővé és megfizethetővé tételének képességére is.
Ebben az összefüggésben a technológiai vállalatok számára az a kérdés, hogyan őrizzék meg kereskedelmi értéküket, amikor egyre több nyílt forráskódú modell jelenik meg versenyképes teljesítménnyel és költséggel.
Forrás: https://dantri.com.vn/cong-nghe/deepseek-am-tham-ra-phien-ban-ai-moi-20250820121017977.htm






Hozzászólás (0)