Il y a quelques années à peine, la Chine s’imaginait dominer la course mondiale à l’IA en exploitant les vastes réserves de données du pays pour développer des applications comme la reconnaissance faciale.

Les récents développements en matière d’IA générative — l’utilisation de grands modèles pour produire du contenu comme du texte, des images et des vidéos — ont modifié l’équilibre, laissant la Chine à nouveau apparaître comme un pays à la traîne.

Le lancement de Sora le 16 février intervient alors que la Chine est confrontée à un défi croissant : la perte d'accès aux processeurs graphiques (GPU) de pointe de Nvidia, due à l'escalade des restrictions américaines à l'exportation. Les meilleurs acteurs chinois de l'IA accusent un retard de plusieurs années sur leurs homologues étrangers.

Zhou Hongyi, fondateur de la société de sécurité Internet 360 Security Technology, a qualifié Sora de « seau d'eau froide versé sur la Chine », a rapporté Yicai le 23 février. Il a ajouté que cela avait aidé de nombreuses personnes à prendre conscience du fossé qui les séparait des dirigeants mondiaux .

OpenAI n'a pas encore publié Sora. Contrairement à certains de ses prédécesseurs, il n'est pas open source. Seul un nombre restreint de personnes ont accès à une version d'essai de Sora.

w9xz2qt5.png
Sora d'OpenAI aide les entreprises technologiques chinoises à combler l'écart qui les sépare des principales technologies d'IA mondiales. (Photo : SCMP)

En Chine, l'Administration nationale du cyberespace exige que tous les grands modèles linguistiques publics (LLM) soient enregistrés auprès du gouvernement. Des géants mondiaux comme OpenAI et Google n'ont pas encore officiellement fourni de services dans ce pays.

Cette absence a conduit de nombreux géants technologiques nationaux à se disputer une place sur le marché avec plus de 200 LLM. Baidu, Tencent et Alibaba ont tous lancé leurs propres LLM.

Cependant, peu d'outils peuvent rivaliser avec Sora, notamment parce qu'ils n'utilisent pas encore la nouvelle architecture Diffusion Transformer (DiT). ByteDance, la société mère de TikTok, affirme que son outil interne de contrôle de mouvement vidéo Boximator, qu'elle utilise pour créer des vidéos, en est encore à ses balbutiements et n'est pas encore prêt pour une diffusion massive.

L'entreprise admet qu'il existe un écart important entre Boximator et les principaux modèles de création vidéo en termes de qualité d'image, de fidélité et de durée.

Plutôt que de rattraper Sora, certains acteurs du secteur estiment que le problème le plus urgent est d'accéder aux modèles d'OpenAI. Or, les législateurs américains cherchent à limiter l'accès de la Chine à ses services cloud d'IA.

Un développeur chinois anonyme a déclaré à SCMP qu'une voie possible pour les ingénieurs chinois en IA serait de « d'abord décoder Sora et de l'entraîner avec leurs propres données pour créer un produit similaire ». Xu Liang, un entrepreneur en IA basé à Hangzhou, pense que la Chine disposera bientôt de services similaires, même s'il pourrait encore y avoir un léger écart entre les produits chinois et Sora.

Wang Shuyi, professeur spécialisé en IA et en apprentissage automatique à l'Université normale de Tianjin (TJNU), a commenté : l'expérience du développement de LLM au cours de l'année écoulée a permis aux grandes entreprises technologiques chinoises d'accumuler des connaissances dans ce domaine et de stocker le matériel nécessaire, leur permettant de produire des produits comme Sora dans les 6 prochains mois.

Quelques mois avant le lancement de Sora, un groupe de chercheurs a lancé VBench, un outil d'analyse comparative pour les modèles de génération vidéo. L'équipe VBench, composée de chercheurs de l'Université technologique de Nanyang à Singapour et du Laboratoire d'intelligence artificielle de Shanghai en Chine, a constaté que Sora surpassait les autres modèles en termes de qualité vidéo globale, d'après des démonstrations fournies par OpenAI.

Lu Yanxia, directeur de recherche d'IDC Chine pour les technologies émergentes, a déclaré que les géants de la technologie tels que Baidu, Alibaba et Tencent seront parmi les premiers à déployer des services similaires dans le pays.

De plus, iFlyTek, SenseTime et Hikvision — qui figurent tous sur la liste des sanctions de Washington — rejoindront également la course, a-t-elle déclaré.

Mais la Chine doit encore faire face à une bataille difficile, car son marché technologique est de plus en plus isolé du monde en termes de capitaux, de matériel, de données et même de personnes, selon les analystes.

L'écart de valeur marchande entre les plus grandes entreprises technologiques chinoises et celles des États-Unis telles que Microsoft, Google et Nvidia s'est considérablement creusé ces dernières années, alors que Pékin a resserré son emprise.

En outre, alors que la Chine était autrefois considérée comme ayant un avantage en termes de quantité de données, Lu a souligné que le pays est désormais confronté à une pénurie de données de qualité nécessaires pour former de nouveaux modèles, associée au défi de l'accès limité aux puces avancées.

La pénurie de talents est une autre préoccupation, selon les dirigeants d'IDC, car les meilleurs talents de l'IA ont souvent plus de facilité à briller lorsqu'ils travaillent pour des acteurs majeurs aux États-Unis. Chez OpenAI, par exemple, les experts technologiques chinois constituent un noyau dur. Sur les 1 677 membres LinkedIn d'OpenAI, 23 ont étudié à l'Université Tsinghua.

Cependant, même avec suffisamment de talent, les experts se demandent jusqu'où l'IA chinoise peut aller tout en étant confrontée aux contraintes existantes liées aux tensions commerciales entre les États-Unis et la Chine.

Dans un rapport, Ping An Securities a averti que les efforts continus visant à restreindre les exportations de puces en provenance des États-Unis pourraient accélérer la maturation de l'industrie chinoise des puces d'IA, mais que « les alternatives nationales pourraient ne pas répondre aux attentes ».

Washington a empêché les entreprises chinoises d'accéder aux semi-conducteurs les plus avancés au monde. En octobre 2023, les États-Unis ont de nouveau renforcé la réglementation, bloquant l'accès du continent aux GPU que Nvidia avait conçus spécifiquement pour les clients chinois afin de contourner les restrictions précédentes.

Alexander Harrowell, analyste en informatique avancée au sein du groupe de recherche et de conseil technologique Omdia, souligne que la Chine dispose d'autres options que les GPU pour la formation LLM, comme TPU de Google, Ascend de Huawei, Trainium d'AWS ou certaines des offres de nombreuses startups. Cependant, cela nécessitera davantage d'efforts en matière de développement logiciel et d'administration système.

Selon l'entrepreneur Xu, le marché chinois bénéficiera d'opportunités particulières lorsque les rapports techniques sur Sora et le modèle vidéo open source seront publiés. « Les entreprises chinoises disposeront d'une plateforme d'apprentissage », a-t-il déclaré. Les modèles vidéo locaux soutiennent également mieux le marché chinois, a-t-il ajouté.

(Selon SCMP)