Néhány évvel ezelőtt Kína elképzelte, hogy végül uralja a globális mesterséges intelligencia versenyt azáltal, hogy az ország hatalmas adatkészletét felhasználva olyan alkalmazások fejlesztésére, mint az arcfelismerés.
A generatív mesterséges intelligencia – vagyis a nagy modellek használata szövegek, képek és videók tartalmának előállításához – legújabb fejlesztései elmozdították az egyensúlyt, így Kína ismét lemaradónak tűnik.
A Sora február 16-i indulása egy olyan időszakban történik, amikor Kína egyre nagyobb kihívással néz szembe, mivel az Egyesült Államok exportkorlátozásainak fokozódása miatt elvágták az Nvidia fejlett grafikus processzoraitól (GPU-k). Az ország legjobb mesterséges intelligencia-szolgáltatói több évvel le vannak maradva külföldi társaiktól.
Zhou Hongyi, a 360 Security Technology internetbiztonsági cég alapítója a Yicai február 23-i beszámolója szerint Sora „egy vödör hideg víznek öntött Kínára”. Azt mondta, hogy ez sok embernek segített meglátni a köztük és a világ vezetői között lévő szakadékot.
Az OpenAI még nem tette közzé a Sora verzióját a nyilvánosság számára. Nem nyílt forráskódú, mint néhány elődje. Csak korlátozott számú ember férhet hozzá a Sora próbaverziójához.
Kínában a Nemzeti Kibertér-adminisztráció előírja, hogy minden nyilvános nagy nyelvi modell (LLM) regisztráljon a kormánynál. Az olyan világóriások, mint az OpenAI és a Google, még nem nyújtottak hivatalos szolgáltatásokat itt.
Ez a hiány oda vezetett, hogy számos hazai technológiai óriás verseng a piaci pozíciókért, több mint 200 LLM-mel. A Baidu, a Tencent és az Alibaba is bevezette saját LLM-jét.
Azonban kevés eszköz hasonlítható a Sorához, részben azért, mert még nem használják az új Diffusion Transformer (DiT) architektúrát. A TikTok anyavállalata, a ByteDance azt nyilatkozta, hogy a videók készítését támogató belső videómozgás-vezérlő eszközük, a Boximator még gyerekcipőben jár, és nem áll készen a tömeges megjelenésre.
A cég elismeri, hogy nagy a különbség a Boximator és a vezető videókészítő modellek között a képminőség, a hűség és a időtartam tekintetében.
A Sora leküzdése helyett az iparág egyes szereplői a sürgetőbb kérdésnek az OpenAI modelljeihez való hozzáférés megszerzését tartják. Az amerikai törvényhozók azonban korlátozni szeretnék Kína hozzáférését a mesterséges intelligencia felhőszolgáltatásaihoz.
Egy meg nem nevezett kínai fejlesztő az SCMP-nek elmondta, hogy a kínai MI-mérnökök számára egy lehetséges út az lehet , hogy „először dekódolják a Sorát, és saját adataikkal betanítják egy hasonló termék létrehozásához”. Xu Liang, egy hangcsoui székhelyű MI-vállalkozó úgy véli, hogy Kína hamarosan hasonló szolgáltatásokkal fog rendelkezni, bár még mindig lehet egy kis különbség a kínai termékek és a Sora között.
Wang Shuyi, a Tiencsini Normál Egyetem (TJNU) mesterséges intelligenciára és gépi tanulásra szakosodott professzora így nyilatkozott: „Az elmúlt évben az LLM-ek fejlesztésében szerzett tapasztalatok lehetővé tették a kínai nagyvállalatok számára, hogy ismereteket szerezzenek ezen a területen, és felhalmozzák a szükséges hardvereket, amelyek lehetővé teszik számukra, hogy a következő 6 hónapban olyan termékeket állítsanak elő, mint a Sora.”
Néhány hónappal a Sora indulása előtt egy kutatócsoport kiadta a VBench-et, egy videógeneráló modellekhez használható benchmark eszközt. A VBench csapata, amelyben a szingapúri Nanyang Műszaki Egyetem és a kínai Sanghaji Mesterséges Intelligencia Laboratórium kutatói is részt vettek, az OpenAI által biztosított demók alapján megállapította, hogy a Sora összességében felülmúlta a többi modellt a videóminőségben.
Lu Yanxia, az IDC China feltörekvő technológiákért felelős kutatási igazgatója szerint az olyan technológiai óriások, mint a Baidu, az Alibaba és a Tencent, lesznek az elsők, amelyek hasonló szolgáltatásokat vezetnek be az országban.
Emellett az iFlyTek, a SenseTime és a Hikvision is csatlakozik a versenyhez – amelyek mindegyike szerepel Washington szankciós listáján –, mondta.
Kína azonban továbbra is nehéz helyzetben van, mivel technológiai piaca egyre inkább elszigetelődik a világtól tőke, hardver, adat és még emberi erőforrások tekintetében is, az elemzők szerint.
A kínai vezető technológiai vállalatok és az olyan amerikai vállalatok, mint a Microsoft, a Google és az Nvidia közötti piaci értékbeli különbség jelentősen megnőtt az elmúlt években, mivel Peking fokozta hatalmát.
Továbbá, míg Kínát egykor az adatmennyiség tekintetében előnyben részesítették, Lu úr rámutatott, hogy az ország jelenleg az újabb modellek betanításához szükséges minőségi adatok hiányával küzd, amihez a fejlett chipekhez való korlátozott hozzáférés kihívása is párosul.
Az IDC vezetői szerint a tehetséghiány egy másik aggodalomra ad okot, mivel a mesterséges intelligencia területén a legjobbak és legtehetségesebbek gyakran könnyebben boldogulnak, ha az Egyesült Államok vezető vállalatainál dolgoznak. Az OpenAI-nál például a kínai technológiai szakértők alkotják a magcsoportot. Az OpenAI 1677 LinkedIn-tagjából 23 a Tsinghua Egyetemen tanult.
A szakértők azonban még elegendő tehetséggel is megkérdőjelezik, hogy Kína saját fejlesztésű mesterséges intelligenciája meddig mehet el, miközben az USA és Kína közötti kereskedelmi feszültségek miatt fennálló korlátozásokkal néz szembe.
Egy jelentésben a Ping An Securities arra figyelmeztetett, hogy az Egyesült Államokból származó chipek exportjának korlátozására irányuló folyamatos erőfeszítések felgyorsíthatják Kína mesterséges intelligencia chipiparának fejlődését, de „a hazai alternatívák elmaradhatnak a várakozásoktól”.
Washington megakadályozta a kínai vállalatok hozzáférését a világ legfejlettebb félvezetőihez. 2023 októberében az Egyesült Államok ismét szigorított a szabályozásokon, megakadályozva a szárazföldi kínai hozzáférést azokhoz a GPU-khoz, amelyeket az Nvidia kifejezetten kínai ügyfelek számára tervezett, hogy megkerülje a korábbi korlátozásokat.
Alexander Harrowell, az Omdia technológiai kutató- és tanácsadó csoport haladó számítástechnikai elemzője megjegyzi, hogy Kínának a GPU-kon kívül más lehetőségei is vannak az LLM képzésre, mint például a Google TPU-ja, a Huawei Ascendje, az AWS Trainiumja, vagy számos startup ajánlata. Ez azonban több erőfeszítést igényel a szoftverfejlesztés és a rendszeradminisztráció terén.
Xu vállalkozó szerint a kínai piac különleges lehetőségekhez jut, amikor technikai jelentések jelennek meg a Soráról és a nyílt forráskódú videomodellről. „Ez egy olyan platform lesz, amelyről a kínai vállalatok tanulhatnak” – mondta. A helyi videomodellek is jobban támogatják a kínai nyelvet – tette hozzá.
(Az SCMP szerint)
[hirdetés_2]
Forrás
Hozzászólás (0)