För bara några år sedan föreställde sig Kina att de så småningom skulle dominera den globala AI-kapplöpningen genom att utnyttja landets stora databas för att utveckla applikationer som ansiktsigenkänning.

Den senaste utvecklingen inom generativ AI – att använda stora modeller för att producera innehåll som text, bilder och video – har förskjutit balansen och fått Kina att återigen se ut som en eftersläpare.

Soras lansering den 16 februari kommer samtidigt som Kina står inför en växande utmaning genom att bli avskuret från Nvidias avancerade grafikprocessorer (GPU:er) på grund av eskalerande amerikanska exportrestriktioner. Landets bästa AI-spelare ligger flera år efter sina utländska motsvarigheter.

Zhou Hongyi, grundare av internetsäkerhetsföretaget 360 Security Technology, kallade Sora för ”en hink med kallt vatten som hällts över Kina”, rapporterade Yicai den 23 februari. Han sa att det hjälpte många människor att se klyftan mellan dem och världens ledare.

OpenAI har ännu inte släppt Sora till allmänheten. Det är inte öppen källkod som några av sina föregångare. Endast ett begränsat antal personer har tillgång till en testversion av Sora.

w9xz2qt5.png
OpenAIs Sora hjälper kinesiska teknikföretag att inse klyftan mellan dem och världens ledande AI-tekniker. (Foto: SCMP)

I Kina kräver den nationella cyberspaceadministrationen att alla offentliga stora språkmodeller (LLM) registreras hos regeringen. Världsjättar som OpenAI och Google har ännu inte officiellt tillhandahållit tjänster här.

Denna frånvaro har lett till att många inhemska teknikjättar kämpar om positioner på marknaden med fler än 200 juridikexamina (LLM). Baidu, Tencent och Alibaba har alla introducerat sina egna LLM.

Få verktyg kan dock mäta sig med Sora, delvis för att de ännu inte använder den nya Diffusion Transformer (DiT)-arkitekturen. TikToks moderbolag ByteDance sa att deras interna verktyg för videorörelsekontroll Boximator, som används för att stödja videoskapande, fortfarande är i sin linda och inte redo för masslansering.

Företaget medger att det finns en stor skillnad mellan Boximator och ledande modeller för videoskapande när det gäller bildkvalitet, återgivning och längd.

I stället för att komma ikapp Sora ser vissa i branschen den mer angelägna frågan som att få tillgång till OpenAI:s modeller. Men amerikanska lagstiftare vill begränsa Kinas tillgång till dess AI-molntjänster.

En icke namngiven kinesisk utvecklare berättade för SCMP att en möjlig väg för kinesiska AI-ingenjörer är att ”först avkoda Sora och träna det med sina egna data för att skapa en liknande produkt.” Xu Liang, en AI-entreprenör baserad i Hangzhou, tror att Kina snart kommer att ha liknande tjänster, även om det fortfarande kan finnas ett litet gap mellan kinesiska produkter och Sora.

Wang Shuyi, professor som specialiserar sig på AI och maskininlärning vid Tianjin Normal University (TJNU), kommenterade: erfarenheterna av att utveckla juridikprogram under det senaste året har gjort det möjligt för kinesiska storteknikföretag att bygga upp kunskap inom detta område och lagra nödvändig hårdvara, vilket gör det möjligt för dem att producera produkter som Sora under de kommande sex månaderna.

Några månader före Soras lansering släppte en grupp forskare VBench, ett benchmarkingverktyg för videogenereringsmodeller. VBench-teamet, som inkluderade forskare från Singapores Nanyang Technological University och Shanghai Artificial Intelligence Lab i Kina, fann att Sora överträffade andra modeller i övergripande videokvalitet, baserat på demonstrationer från OpenAI.

Lu Yanxia, ​​IDC Kinas forskningschef för framväxande teknologier, sa att teknikjättar som Baidu, Alibaba och Tencent kommer att vara bland de första att lansera liknande tjänster i landet.

Dessutom kommer iFlyTek, SenseTime och Hikvision – som alla finns på Washingtons sanktionslista – också att ansluta sig till tävlingen, sa hon.

Men Kina står fortfarande inför en uppförsbacke i takt med att dess teknikmarknad blir alltmer isolerad från världen när det gäller kapital, hårdvara, data och till och med människor, enligt analytiker.

Marknadsvärdesgapet mellan Kinas största teknikföretag och de i USA som Microsoft, Google och Nvidia har ökat avsevärt de senaste åren i takt med att Peking har skärpt sitt grepp om marknaden.

Dessutom, medan Kina en gång ansågs ha en fördel när det gäller datamängd, påpekade Lu att landet nu står inför en brist på kvalitetsdata som behövs för att träna nyare modeller, i kombination med utmaningen med begränsad tillgång till avancerade chips.

Bristen på talang är ett annat problem, enligt chefer på IDC, eftersom de bästa och smartaste inom AI ofta har lättare att lyckas genom att arbeta för ledande aktörer i USA. På OpenAI, till exempel, utgör teknikexperter från Kina en kärngrupp. Av OpenAIs 1 677 LinkedIn-medlemmar studerade 23 vid Tsinghua University.

Men även med tillräckligt med talang ifrågasätter experter hur långt Kinas inhemska AI kan gå samtidigt som man står inför befintliga begränsningar från handelsspänningar mellan USA och Kina.

I en rapport varnade Ping An Securities för att fortsatta ansträngningar att begränsa chipsexporten från USA skulle kunna påskynda mognaden av Kinas AI-chipindustri, men "inhemska alternativ kan komma att inte leva upp till förväntningarna".

Washington har blockerat kinesiska företag från att få tillgång till världens mest avancerade halvledare. I oktober 2023 skärpte USA reglerna igen och blockerade fastlandets tillgång till GPU:er som Nvidia hade designat specifikt för kinesiska kunder för att undvika tidigare restriktioner.

Alexander Harrowell, avancerad dataanalytiker på teknikforsknings- och konsultgruppen Omdia, noterar att Kina har andra alternativ än GPU:er för LLM-utbildning, såsom Googles TPU, Huaweis Ascend, AWS Trainium eller ett av ett antal startupserbjudanden. Det kommer dock att kräva mer ansträngning inom mjukvaruutveckling och systemadministration.

Den kinesiska marknaden kommer att ha speciella möjligheter, enligt entreprenören Xu, när tekniska rapporter om Sora och videomodellen med öppen källkod publiceras. ”Det kommer att finnas en plattform för kinesiska företag att lära sig av”, sa han. Lokala videomodeller stöder också kinesiska språk bättre, tillade han.

(Enligt SCMP)