Noch vor wenigen Jahren stellte sich China vor, den globalen KI-Wettlauf eines Tages zu dominieren, indem es den riesigen Datenschatz des Landes nutzte, um Anwendungen wie die Gesichtserkennung zu entwickeln.

Die jüngsten Entwicklungen im Bereich der generativen KI – bei der große Modelle zur Erzeugung von Inhalten wie Text, Bildern und Videos eingesetzt werden – haben das Kräfteverhältnis verschoben, sodass China einmal mehr als Nachzügler dasteht.

Soras Markteinführung am 16. Februar erfolgt zu einem Zeitpunkt, an dem China aufgrund zunehmender US-Exportbeschränkungen vor wachsenden Herausforderungen steht: Der Zugang zu Nvidias fortschrittlichen Grafikprozessoren (GPUs) wird eingeschränkt. Chinas führende KI-Unternehmen hinken ihren ausländischen Konkurrenten um Jahre hinterher.

Zhou Hongyi, Gründer des Internetsicherheitsunternehmens 360 Security Technology, bezeichnete Sora laut einem Bericht von Yicai vom 23. Februar als „einen Eimer kaltes Wasser, der über China gegossen wurde“. Er sagte, es habe vielen Menschen geholfen, die Kluft zwischen ihnen und den Führern der Welt zu erkennen.

OpenAI hat Sora noch nicht öffentlich freigegeben. Es ist nicht Open Source wie einige seiner Vorgänger. Nur eine begrenzte Anzahl von Personen hat Zugriff auf eine Testversion von Sora.

w9xz2qt5.png
OpenAIs Sora hilft chinesischen Technologieunternehmen, die Lücke zu den weltweit führenden KI-Technologien zu schließen. (Foto: SCMP)

In China müssen sich alle öffentlich zugänglichen großen Sprachmodelle (LLMs) bei der Regierung registrieren lassen. Weltweit führende Unternehmen wie OpenAI und Google bieten ihre Dienste hier bisher nicht offiziell an.

Diese Lücke hat dazu geführt, dass viele einheimische Technologiekonzerne mit über 200 LLMs um Marktanteile ringen. Baidu, Tencent und Alibaba haben alle ihre eigenen LLMs eingeführt.

Allerdings können nur wenige Tools mit Sora mithalten, unter anderem, weil sie die neue Diffusion Transformer (DiT)-Architektur noch nicht nutzen. ByteDance, die Muttergesellschaft von TikTok, erklärte, dass sich ihr internes Video-Motion-Control-Tool Boximator, das zur Unterstützung der Videoerstellung eingesetzt wird, noch in der Entwicklungsphase befinde und noch nicht für den Massenmarkt bereit sei.

Das Unternehmen räumt ein, dass zwischen Boximator und führenden Videoproduktionsmodellen eine große Lücke in Bezug auf Bildqualität, Wiedergabetreue und Dauer besteht.

Anstatt mit Sora gleichzuziehen, sehen einige Branchenvertreter die dringendere Herausforderung darin, Zugang zu den Modellen von OpenAI zu erhalten. US-Gesetzgeber wollen jedoch Chinas Zugang zu den KI-Cloud-Diensten von OpenAI einschränken.

Ein namentlich nicht genannter chinesischer Entwickler erklärte gegenüber der SCMP, ein möglicher Weg für chinesische KI-Ingenieure bestehe darin , „Sora zunächst zu entschlüsseln und es mit eigenen Daten zu trainieren, um ein ähnliches Produkt zu entwickeln“. Xu Liang, ein KI-Unternehmer aus Hangzhou, glaubt, dass China bald ähnliche Dienste anbieten wird, obwohl es möglicherweise noch eine kleine Lücke zwischen chinesischen Produkten und Sora geben wird.

Wang Shuyi, Professor für KI und maschinelles Lernen an der Tianjin Normal University (TJNU), kommentierte: Die Erfahrungen mit der Entwicklung von LLMs im vergangenen Jahr haben es den großen chinesischen Technologieunternehmen ermöglicht, sich Wissen auf diesem Gebiet anzueignen und die notwendige Hardware zu horten, sodass sie in den nächsten 6 Monaten Produkte wie Sora herstellen können.

Wenige Monate vor dem Start von Sora veröffentlichte eine Forschergruppe VBench, ein Benchmark-Tool für Videogenerierungsmodelle. Das VBench-Team, dem Forscher der Nanyang Technological University in Singapur und des Shanghai Artificial Intelligence Lab in China angehörten, stellte anhand von Demos von OpenAI fest, dass Sora andere Modelle hinsichtlich der Gesamtvideoqualität übertraf.

Lu Yanxia, ​​Forschungsdirektorin für neue Technologien bei IDC China, sagte, dass Technologiegiganten wie Baidu, Alibaba und Tencent zu den ersten gehören werden, die ähnliche Dienste im Land einführen.

Darüber hinaus werden auch iFlyTek, SenseTime und Hikvision – die alle auf der Sanktionsliste Washingtons stehen – in den Wettbewerb einsteigen, sagte sie.

Analysten zufolge steht China jedoch weiterhin vor großen Herausforderungen, da sein Technologiemarkt in Bezug auf Kapital, Hardware, Daten und sogar Menschen zunehmend von der Welt isoliert wird.

Die Marktwertlücke zwischen Chinas führenden Technologieunternehmen und denen in den USA wie Microsoft, Google und Nvidia hat sich in den letzten Jahren deutlich vergrößert, da Peking seinen Einfluss verstärkt hat.

Darüber hinaus wies Herr Lu darauf hin, dass China zwar einst einen Vorteil in Bezug auf die Datenmenge hatte, das Land aber nun mit einem Mangel an qualitativ hochwertigen Daten für das Training neuerer Modelle konfrontiert sei, verbunden mit der Herausforderung des begrenzten Zugangs zu fortschrittlichen Chips.

Der Fachkräftemangel ist laut IDC-Managern ein weiteres Problem, da die besten KI-Experten oft leichter Fuß fassen können, wenn sie für führende Unternehmen in den USA arbeiten. Bei OpenAI beispielsweise bilden Technologieexperten aus China einen Kern des Teams. Von den 1.677 LinkedIn-Mitgliedern von OpenAI haben 23 an der Tsinghua-Universität studiert.

Doch selbst mit genügend Talenten bezweifeln Experten, wie weit Chinas einheimische KI angesichts der bestehenden Einschränkungen durch die Handelsspannungen zwischen den USA und China kommen kann.

In einem Bericht warnte Ping An Securities davor, dass die fortgesetzten Bemühungen zur Einschränkung der Chip-Exporte aus den USA die Reifung der chinesischen KI-Chipindustrie beschleunigen könnten, aber „inländische Alternativen könnten hinter den Erwartungen zurückbleiben“.

Washington hat chinesischen Unternehmen den Zugang zu den weltweit fortschrittlichsten Halbleitern verwehrt. Im Oktober 2023 verschärften die USA die Bestimmungen erneut und blockierten den Zugang des chinesischen Festlands zu GPUs, die Nvidia speziell für chinesische Kunden entwickelt hatte, um frühere Beschränkungen zu umgehen.

Alexander Harrowell, Analyst für fortgeschrittene Computertechnologie beim Technologieberatungsunternehmen Omdia, merkt an, dass China neben GPUs auch andere Optionen für die LLM-Ausbildung hat, beispielsweise Googles TPU, Huaweis Ascend, AWS Trainium oder Angebote verschiedener Startups. Dies erfordert jedoch einen höheren Aufwand in der Softwareentwicklung und Systemadministration.

Laut Unternehmer Xu ergeben sich für den chinesischen Markt besondere Chancen, sobald technische Berichte über Sora und das Open-Source-Videomodell veröffentlicht werden. „Chinesische Unternehmen werden davon profitieren können“, sagte er. Lokale Videomodelle seien zudem besser auf chinesische Nutzer zugeschnitten, fügte er hinzu.

(Laut SCMP)