Slechts een paar jaar geleden dacht China dat het de wereldwijde AI-race zou domineren door de enorme hoeveelheid data van het land te benutten om toepassingen als gezichtsherkenning te ontwikkelen.

Recente ontwikkelingen op het gebied van generatieve AI – het gebruik van grote modellen om content te produceren zoals tekst, afbeeldingen en video – hebben de balans doen verschuiven, waardoor China opnieuw als een achterblijver wordt gezien.

De lancering van Sora op 16 februari komt op een moment dat China te maken krijgt met een groeiende uitdaging: China wordt afgesloten van Nvidia's geavanceerde grafische processors (GPU's) vanwege de toenemende Amerikaanse exportbeperkingen. De beste AI-spelers van het land lopen jaren achter op hun buitenlandse concurrenten.

Zhou Hongyi, oprichter van internetbeveiligingsbedrijf 360 Security Technology, noemde Sora "een emmer koud water over China uitgegoten", meldde Yicai op 23 februari. Hij zei dat het veel mensen hielp de kloof tussen hen en de wereldleiders te zien.

OpenAI heeft Sora nog niet voor het publiek uitgebracht. Het is niet open source zoals sommige voorgangers. Slechts een beperkt aantal mensen heeft toegang tot een proefversie van Sora.

w9xz2qt5.png
Sora van OpenAI helpt Chinese technologiebedrijven de kloof tussen hen en de toonaangevende AI-technologieën ter wereld te overbruggen. (Foto: SCMP)

In China vereist de National Cyberspace Administration dat alle openbare grote taalmodellen (LLM's) zich registreren bij de overheid. Wereldreuzen zoals OpenAI en Google bieden hier nog geen officiële diensten aan.

Deze afwezigheid heeft ertoe geleid dat veel binnenlandse techgiganten met meer dan 200 LLM's om een ​​positie op de markt strijden. Baidu, Tencent en Alibaba hebben allemaal hun eigen LLM's geïntroduceerd.

Er zijn echter maar weinig tools die zich kunnen meten met Sora, deels omdat ze nog niet gebruikmaken van de nieuwe Diffusion Transformer (DiT)-architectuur. ByteDance, het moederbedrijf van TikTok, gaf aan dat hun interne videobewegingsbesturingstool Boximator, die wordt gebruikt om video's te maken, nog in de kinderschoenen staat en nog niet klaar is voor massale release.

Het bedrijf geeft toe dat er een groot verschil is tussen Boximator en toonaangevende videomodellen als het gaat om beeldkwaliteit, getrouwheid en duur.

In plaats van Sora bij te benen, zien sommigen in de industrie het verkrijgen van toegang tot de modellen van OpenAI als een dringender probleem. Amerikaanse wetgevers willen echter de toegang van China tot zijn AI-clouddiensten beperken.

Een anonieme Chinese ontwikkelaar vertelde SCMP dat een mogelijke oplossing voor Chinese AI-ingenieurs is om "Sora eerst te decoderen en te trainen met hun eigen data om een ​​soortgelijk product te creëren." Xu Liang, een AI-ondernemer uit Hangzhou, gelooft dat China binnenkort soortgelijke diensten zal hebben, hoewel er mogelijk nog een kleine kloof zal zijn tussen Chinese producten en Sora.

Wang Shuyi, een professor gespecialiseerd in AI en machine learning aan de Tianjin Normal University (TJNU), merkte op: de ervaring met de ontwikkeling van LLM's in het afgelopen jaar heeft Chinese Big Techs in staat gesteld om kennis op te bouwen op dit gebied en de benodigde hardware op te slaan, zodat ze producten als Sora in de komende 6 maanden kunnen produceren.

Een paar maanden voor de lancering van Sora bracht een groep onderzoekers VBench uit, een benchmarktool voor videogeneratiemodellen. Het VBench-team, bestaande uit onderzoekers van de Nanyang Technological University in Singapore en het Shanghai Artificial Intelligence Lab in China, ontdekte dat Sora andere modellen overtrof in algehele videokwaliteit, gebaseerd op demo's van OpenAI.

Lu Yanxia, ​​onderzoeksdirecteur voor opkomende technologieën bij IDC China, zei dat technologiegiganten zoals Baidu, Alibaba en Tencent tot de eersten zullen behoren die vergelijkbare diensten in het land gaan uitrollen.

Daarnaast zullen ook iFlyTek, SenseTime en Hikvision, die allemaal op de sanctielijst van Washington staan, meedoen aan de race, zei ze.

Analisten stellen dat China het nog steeds moeilijk heeft, omdat de techmarkt steeds meer geïsoleerd raakt van de rest van de wereld op het gebied van kapitaal, hardware, data en zelfs mensen.

Het verschil in marktwaarde tussen de grootste Chinese technologiebedrijven en Amerikaanse bedrijven zoals Microsoft, Google en Nvidia is de afgelopen jaren aanzienlijk groter geworden, omdat Beijing zijn greep op de markt steeds sterker maakt.

Daarnaast werd China ooit gezien als een land met een voorsprong op het gebied van datahoeveelheid. De heer Lu wees er echter op dat het land nu kampt met een schaarste aan kwaliteitsdata die nodig zijn om nieuwere modellen te trainen. Daarnaast kampt het land met de uitdaging van beperkte toegang tot geavanceerde chips.

Het tekort aan talent is een andere zorg, aldus IDC-managers, aangezien de beste en slimste AI-professionals vaak makkelijker kunnen schitteren door te werken voor toonaangevende spelers in de VS. Bij OpenAI bijvoorbeeld vormen Chinese tech-experts een kerngroep. Van de 1677 LinkedIn-leden van OpenAI studeerden er 23 aan de Tsinghua-universiteit.

Maar zelfs met voldoende talent vragen deskundigen zich af in hoeverre China's eigen AI kan presteren als het te maken krijgt met de huidige beperkingen die voortvloeien uit de handelsspanningen tussen de VS en China.

In een rapport waarschuwde Ping An Securities dat aanhoudende pogingen om de export van chips uit de VS te beperken de ontwikkeling van de Chinese AI-chipindustrie zouden kunnen versnellen, maar dat "binnenlandse alternatieven mogelijk niet aan de verwachtingen voldoen."

Washington heeft Chinese bedrijven de toegang tot 's werelds meest geavanceerde halfgeleiders ontzegd. In oktober 2023 verscherpten de VS de regelgeving opnieuw, waardoor Chinese bedrijven geen toegang meer hebben tot GPU's die Nvidia speciaal voor Chinese klanten had ontworpen om eerdere beperkingen te omzeilen.

Alexander Harrowell, een analist in geavanceerde computing bij de technologische onderzoeks- en adviesgroep Omdia, merkt op dat China andere opties dan GPU's heeft voor LLM-training, zoals TPU van Google, Ascend van Huawei, Trainium van AWS of een van de vele startups. Dit vereist echter meer inspanning op het gebied van softwareontwikkeling en systeembeheer.

Volgens ondernemer Xu biedt de Chinese markt speciale kansen wanneer technische rapporten over Sora en het open-source videomodel worden gepubliceerd. "Er ontstaat een platform waar Chinese bedrijven van kunnen leren", zei hij. Lokale videomodellen ondersteunen Chinese bedrijven ook beter, voegde hij eraan toe.

(Volgens SCMP)