Il y a quelques années encore, la Chine s'imaginait dominer un jour la course mondiale à l'IA en exploitant l'immense réserve de données du pays pour développer des applications comme la reconnaissance faciale.
Les récents développements en matière d'IA générative – utilisant de grands modèles pour produire du contenu comme du texte, des images et des vidéos – ont modifié la donne, donnant une fois de plus à la Chine l'apparence d'un pays à la traîne.
Le lancement de Sora le 16 février intervient alors que la Chine est confrontée à un défi croissant : l’accès aux processeurs graphiques (GPU) de pointe de Nvidia lui est refusé en raison du renforcement des restrictions américaines à l’exportation. Les meilleurs acteurs chinois en matière d’IA accusent plusieurs années de retard sur leurs concurrents étrangers.
Zhou Hongyi, fondateur de la société de sécurité internet 360 Security Technology, a qualifié Sora de « seau d'eau froide déversé sur la Chine », rapportait Yicai le 23 février. Il a déclaré que cela avait permis à de nombreuses personnes de prendre conscience du fossé qui les séparait des dirigeants mondiaux .
OpenAI n'a pas encore rendu Sora accessible au public. Contrairement à certains de ses prédécesseurs, il n'est pas open source. Seule une version d'essai de Sora est disponible pour un nombre limité de personnes.
En Chine, l'Administration nationale du cyberespace exige que tous les grands modèles de langage publics (LLM) soient enregistrés auprès du gouvernement. Les géants mondiaux tels qu'OpenAI et Google n'y proposent pas encore officiellement leurs services.
Cette absence a incité de nombreux géants technologiques chinois à se disputer les parts de marché, avec plus de 200 plateformes de marketing digital (LLM). Baidu, Tencent et Alibaba ont tous lancé leurs propres LLM.
Cependant, peu d'outils peuvent rivaliser avec Sora, notamment parce qu'ils n'utilisent pas encore la nouvelle architecture Diffusion Transformer (DiT). ByteDance, la société mère de TikTok, a déclaré que son outil interne de contrôle de mouvement vidéo, Boximator, utilisé pour la création de vidéos, est encore en développement et n'est pas prêt pour une diffusion à grande échelle.
L'entreprise reconnaît qu'il existe un écart important entre Boximator et les principaux modèles de création vidéo en termes de qualité d'image, de fidélité et de durée.
Plutôt que de rattraper Sora, certains acteurs du secteur estiment que l'accès aux modèles d'OpenAI est l'enjeu le plus urgent. Cependant, les législateurs américains cherchent à limiter l'accès de la Chine à ses services cloud d'IA.
Un développeur chinois anonyme a déclaré au SCMP qu'une piste possible pour les ingénieurs chinois en IA serait de « décoder Sora et de l'entraîner avec leurs propres données afin de créer un produit similaire ». Xu Liang, un entrepreneur en IA basé à Hangzhou, estime que la Chine proposera bientôt des services similaires, même s'il pourrait subsister un léger écart entre les produits chinois et Sora.
Wang Shuyi, professeur spécialisé en IA et en apprentissage automatique à l'Université normale de Tianjin (TJNU), a commenté : l'expérience acquise dans le développement de LLM au cours de l'année écoulée a permis aux grandes entreprises technologiques chinoises d'accumuler des connaissances dans ce domaine et de constituer des stocks de matériel nécessaires, leur permettant ainsi de produire des produits comme Sora dans les 6 prochains mois.
Quelques mois avant le lancement de Sora, une équipe de chercheurs a publié VBench, un outil d'évaluation comparative des modèles de génération vidéo. Cette équipe, composée de chercheurs de l'Université technologique de Nanyang à Singapour et du Laboratoire d'intelligence artificielle de Shanghai en Chine, a constaté que Sora surpassait les autres modèles en termes de qualité vidéo globale, d'après les démonstrations fournies par OpenAI.
Lu Yanxia, directrice de recherche d'IDC Chine pour les technologies émergentes, a déclaré que les géants technologiques tels que Baidu, Alibaba et Tencent seront parmi les premiers à déployer des services similaires dans le pays.
Par ailleurs, iFlyTek, SenseTime et Hikvision – qui figurent toutes sur la liste des sanctions de Washington – se joindront également à la course, a-t-elle déclaré.
Mais la Chine reste confrontée à une tâche ardue, son marché technologique étant de plus en plus isolé du reste du monde en termes de capitaux, de matériel, de données et même de personnel, selon les analystes.
L'écart de valeur marchande entre les principales entreprises technologiques chinoises et celles des États-Unis, telles que Microsoft, Google et Nvidia, s'est considérablement creusé ces dernières années, à mesure que Pékin renforçait son emprise.
Par ailleurs, alors que la Chine était autrefois considérée comme ayant un avantage en termes de quantité de données, M. Lu a souligné que le pays est désormais confronté à une pénurie de données de qualité nécessaires à l'entraînement de nouveaux modèles, à laquelle s'ajoute le défi d'un accès limité aux puces avancées.
La pénurie de talents est une autre source d'inquiétude, selon les dirigeants d'IDC, car les meilleurs experts en IA ont souvent plus de facilité à se distinguer en travaillant pour les leaders du secteur aux États-Unis. Chez OpenAI, par exemple, les experts en technologies originaires de Chine constituent un noyau dur. Sur les 1 677 membres d'OpenAI sur LinkedIn, 23 ont étudié à l'université Tsinghua.
Cependant, même avec suffisamment de talents, les experts se demandent jusqu'où l'IA développée en Chine pourra aller compte tenu des contraintes existantes liées aux tensions commerciales sino-américaines.
Dans un rapport, Ping An Securities a averti que la poursuite des efforts visant à restreindre les exportations de puces en provenance des États-Unis pourrait accélérer la maturation de l'industrie chinoise des puces d'IA, mais que « les alternatives nationales pourraient ne pas être à la hauteur des attentes ».
Washington a empêché les entreprises chinoises d'accéder aux semi-conducteurs les plus avancés au monde. En octobre 2023, les États-Unis ont de nouveau durci leur réglementation, bloquant l'accès du territoire chinois aux GPU que Nvidia avait conçus spécifiquement pour les clients chinois afin de contourner les restrictions précédentes.
Alexander Harrowell, analyste en informatique avancée chez Omdia, un groupe de recherche et de conseil en technologies, souligne que la Chine dispose d'alternatives aux GPU pour la formation LLM, comme les TPU de Google, Ascend de Huawei, Trainium d'AWS, ou encore les solutions proposées par de nombreuses start-ups. Cependant, cela nécessitera un investissement plus important en matière de développement logiciel et d'administration système.
D'après l'entrepreneur Xu, le marché chinois bénéficiera d'opportunités exceptionnelles lors de la publication des rapports techniques sur Sora et le modèle vidéo open source. « Les entreprises chinoises disposeront ainsi d'une plateforme d'apprentissage », a-t-il déclaré. Il a également ajouté que les modèles vidéo locaux offrent un meilleur soutien aux utilisateurs chinois.
(Selon le SCMP)
Source






Comment (0)