Szakértők szerint az Egyesült Államok segített Kínának alacsony költséggel fejleszteni a mesterséges intelligenciát (MI), mivel Washington korlátozta Peking hozzáférését a fejlett, de drága chipekhez.
A DeepSeek mesterséges intelligencia által működtetett chatbot alkalmazás (Kína) logója a ChatGPT alkalmazás (USA) mellett okostelefon képernyőjén - Fotó: AFP
Míg az amerikai technológiai óriások azt állítják, hogy több százmilliárd dollárt költenek a legfejlettebb mesterséges intelligencia modellek fejlesztésére, a kínai DeepSeek startup az ellenkezőjét bizonyítja: csak néhány millió dollár kell hozzá.
A szükség a találmányok anyja
„Amikor a ChatGPT 2022 novemberében elindult, az Egyesült Államok még mindig vezető szerepet töltött be a generatív mesterséges intelligencia területén. Az elmúlt két évben azonban ez a szakadék fokozatosan eltűnt” – osztotta meg Andrew Ng professzort a South China Morning Posttal (SCMP), akit a 2023-as globális mesterséges intelligencia 100 legbefolyásosabb embere közé soroltak.
Ezt a megjegyzést a DeepSeek, egy kínai mesterséges intelligencia startup kapcsán tette, amely meglepetést okozott, amikor 2025 januárjában elindított egy ingyenes, a ChatGPT-hez hasonló mesterséges intelligencia modellt.
Ng úr szerint az olyan modellek megjelenésével, mint a Qwen, a Kimi, az InternVL és a DeepSeek, Kína nemcsak csökkentette a szakadékot, hanem fokozatosan vezető szerepet is vállalt a mesterséges intelligencia egyes területein. A China Daily hangsúlyozta, hogy a DeepSeek nyílt forráskódú kódot használ a mesterséges intelligencia eszközeinek fejlesztéséhez, lehetővé téve a széles körű együttműködést és kísérletezést, elősegítve a gyorsabb áttöréseket az iparágban.
Az amerikai mesterséges intelligencia technológiai vállalatokkal összehasonlítva a DeepSeek nyilvánosan közzétett fejlesztési költsége kevesebb, mint 6 millió dollár. Ez cáfolja azt az érvet, miszerint a mesterséges intelligencia betanítása dollármilliárdokba kerülne, ahogy azt az amerikai vállalatok gyakran állítják.
Annak ellenére, hogy Washington betiltotta a legmodernebb chipekhez való hozzáférést, a DeepSeek bebizonyítja, hogy a mesterséges intelligencia iparágnak nem kell olyan óriásokra támaszkodnia, mint az Nvidia. Kína chatbotjának mindössze 2000 alacsony tétű chipre volt szüksége a fejlesztéshez, míg a Meta legújabb Llama 3.1 mesterséges intelligencia modelljéhez 16 000 Nvidia élvonalbeli H100 chip kellett.
Röviddel a megjelenése után a DeepSeek chatbotja gyorsan az Apple App Store rangsorának élére emelkedett, megelőzve a ChatGPT-t. Január 20-án a DeepSeek kiadta nyílt forráskódú R1 modelljét, amelyről úgy tartják, hogy a zárt forráskódú ChatGPT modell funkcióival egyenértékűek. Figyelemre méltó, hogy Sam Altman, az OpenAI vezérigazgatója is dicsérte a DeepSeek megközelítését.
Sok pénzbe kerül a mesterséges intelligencia fejlesztése?
Február 3-án az Independent újság arról számolt be, hogy egy amerikai kutatócsoport mindössze néhány tucat dollárért újraalkotta a DeepSeek mesterséges intelligenciával működő chatbotját, megerősítve az alacsony költségű mesterséges intelligenciafejlesztés trendjét. A kaliforniai Berkeley-i Egyetem kutatócsoportja azt állította, hogy kevesebb mint 30 dollárért lemásolta a DeepSeek R1 modelljét.
„A DeepSeek R1-Zero-t a CountDown játékban is lemásoltuk, és jól működik” – osztotta meg Jiayi Pan PhD hallgató az X platformon. Pan reméli, hogy ez a projekt hozzáférhetőbbé teszi a mesterséges intelligenciát.
A DeepSeek és Mr. Pan csapatának projektjének sikere azt mutatja, hogy a mesterséges intelligencia betanításának költsége jóval alacsonyabb lehet, mint az amerikai technológiai vállalatok által állítólagos több százmilliárd dollár.
Technológiai szakértők szerint a DeepSeek mélyreható hatással lehet a mesterséges intelligencia fejlesztésére és használatára a jövőben. Yann LeCun, a Meta Platforms mesterséges intelligencia -tudósa szerint a DeepSeeket nem szabad úgy értelmezni, hogy „Kína megelőzi az Egyesült Államokat a mesterséges intelligencia terén”. Ehelyett azt mondja, hogy a helyes megfogalmazás az, hogy „A nyílt forráskódú modellek felülmúlják a zárt forráskódú modelleket” – áll az SCMP-n megjelent cikkben.
A DeepSeek megváltoztatja a megközelítését, nem pedig a „játékváltoztatót”
Dang Huu Son úr – az Alkalmazott Technológiai Kutatási és Emberi Erőforrás Fejlesztési Intézet igazgatóhelyettese, a LovinBot AI társalapítója és vezérigazgatója – így nyilatkozott: „A DeepSeek valószínűleg nem fog „játékváltoztató” lenni a mesterséges intelligencia területén hosszú távon.”
Son úr szerint a DeepSeek sikeresen teljesítette a legfontosabb feladatot: megváltoztatta a befektetők és a vállalkozások szemléletét a mesterséges intelligencia technológia „népszerűsítésének” trendjében – az alacsony költségek és a könnyű hozzáférés felé. Hosszú távon azonban nagy kihívásokkal kell szembenézniük a beruházási költségek és a modellminőség fenntartásáért folytatott kiélezett verseny terén.
A DeepSeek – egy alacsony költségű, alacsony erőforrás-igényű, nyílt forráskódú mesterséges intelligencia modell – megjelenése felkeltette a figyelmet, arra kényszerítve az amerikai MI-óriásokat, hogy újragondolják stratégiájukat. Ez az eset hasonló a Temu esetéhez, amely egy alacsony költségű stratégiát választott a versenyben.
A szakértők szerint azonban a DeepSeek teljesítményben nem igazán múlja felül a többi csúcskategóriás modellt, és korlátai vannak az összetett feladatok kezelésében.
A DeepSeek egyik egyedi tulajdonsága, hogy lehetővé teszi a felhasználók számára, hogy lássák a „gondolkodási folyamatot”, miközben az következtetéseket von le. Ez azonban komoly biztonsági réseket nyit meg. A szakértők rámutattak, hogy a DeepSeek számos támadásnak kitett, az egyszerű nyelvi manipulációtól kezdve a mesterséges intelligencia által generált összetett „promptokig”.
Továbbá a költségoptimalizálás arra kényszerítette a DeepSeeket, hogy csökkentse bizonyos védelmi mechanizmusok hatékonyságát. Ezáltal a rendszer sebezhetővé vált a kifinomult taktikák alkalmazásával szemben, ami a nem kívánt információk visszaküldésének vagy a viselkedés manipulálásának kockázatához vezetett.
Vietnámban a DeepSeekből levont tanulságok lehetőséget nyitnak a mesterséges intelligencia fejlesztésére elfogadható áron, a biztonság garantálása mellett. A LovinBot AI jelenleg kutatásokat végez, de még nem integrálta a DeepSeeket az alacsony költsége és a nyílt forráskód ellenére, mivel a legfontosabb követelmény továbbra is az információbiztonság és a tartalommanipuláció kockázatának elkerülése.
[hirdetés_2]
Forrás: https://tuoitre.vn/trung-quoc-pha-gia-ai-20250205001728107.htm
Hozzászólás (0)