Лише кілька років тому Китай уявляв, що зрештою стане домінантом у світовій гонці штучного інтелекту, використовуючи величезні сховища даних країни для розробки таких програм, як розпізнавання облич.

Нещодавні розробки в генеративному штучному інтелекті – використанні великих моделей для створення контенту, такого як текст, зображення та відео – змістили баланс, знову залишивши Китай відсталим.

Запуск Sora 16 лютого відбувається на тлі дедалі більшої проблеми, пов'язаної з відрізанням від передових графічних процесорів (GPU) Nvidia через посилення експортних обмежень США. Найкращі гравці країни в галузі штучного інтелекту відстають від своїх іноземних колег на кілька років.

Чжоу Хун'ї, засновник фірми з інтернет-безпеки 360 Security Technology, назвав Сору «відром холодної води, вилитою на Китай», повідомив Yicai 23 лютого. Він сказав, що це допомогло багатьом людям побачити розрив між ними та світовими лідерами.

OpenAI ще не випустив Sora для публіки. Він не має відкритого коду, як деякі його попередники. Лише обмежена кількість людей має доступ до пробної версії Sora.

w9xz2qt5.png
Sora від OpenAI допомагає китайським технологічним компаніям усвідомити розрив між ними та провідними світовими технологіями штучного інтелекту. (Фото: SCMP)

У Китаї Національне управління кіберпростору вимагає від усіх публічних моделей великих мов програмування (LLM) реєстрації в уряді. Світові гіганти, такі як OpenAI та Google, ще офіційно не надають тут послуги.

Ця відсутність призвела до того, що багато вітчизняних технологічних гігантів борються за позиції на ринку, маючи понад 200 програм магістратури (LLM). Baidu, Tencent та Alibaba представили власні LLM.

Однак, мало які інструменти можуть зрівнятися з Sora, частково тому, що вони ще не використовують нову архітектуру Diffusion Transformer (DiT). Материнська компанія TikTok, ByteDance, заявила, що її внутрішній інструмент керування рухом відео Boximator, який використовується для підтримки створення відео, все ще перебуває на початковій стадії розвитку та не готовий до масового випуску.

Компанія визнає, що між Boximator та провідними моделями для створення відео існує велика різниця в якості зображення, точності та тривалості.

Замість того, щоб наздогнати Сору, деякі представники галузі вважають більш нагальним питанням отримання доступу до моделей OpenAI. Але законодавці США прагнуть обмежити доступ Китаю до його хмарних сервісів штучного інтелекту.

Неназваний китайський розробник повідомив SCMP, що можливий шлях для китайських інженерів зі штучного інтелекту полягає в тому, щоб «спочатку розшифрувати Sora та навчити її на власних даних, щоб створити аналогічний продукт». Сюй Лян, підприємець у сфері штучного інтелекту з Ханчжоу, вважає, що Китай незабаром матиме подібні сервіси, хоча між китайськими продуктами та Sora все ще може існувати невелика різниця.

Ван Шуї, професор, що спеціалізується на штучному інтелекті та машинному навчанні в Тяньцзіньському педагогічному університеті (TJNU), прокоментував: досвід розробки програм магістратури з ліцензування (LLM) за останній рік дозволив великим китайським технологічним компаніям накопичити знання в цій галузі та накопичити необхідне обладнання, що дозволить їм виробляти такі продукти, як Sora, протягом наступних 6 місяців.

За кілька місяців до запуску Sora група дослідників випустила VBench, інструмент для бенчмаркінгу моделей генерації відео. Команда VBench, до складу якої входили дослідники з Наньянського технологічного університету в Сінгапурі та Шанхайської лабораторії штучного інтелекту в Китаї, виявила, що Sora перевершує інші моделі за загальною якістю відео, базуючись на демонстраціях, наданих OpenAI.

Лу Янься, директор з досліджень нових технологій IDC China, заявив, що такі технологічні гіганти, як Baidu, Alibaba та Tencent, будуть одними з перших, хто запровадить аналогічні послуги в країні.

Крім того, за її словами, до перегонів також приєднаються iFlyTek, SenseTime та Hikvision, усі з яких перебувають у списку санкцій Вашингтона.

Але, за словами аналітиків, Китай все ще стикається з важкою боротьбою, оскільки його ринок технологій стає дедалі ізольованішим від світу з точки зору капіталу, обладнання, даних і навіть людей.

Розрив у ринковій вартості між провідними технологічними компаніями Китаю та такими американськими, як Microsoft, Google та Nvidia, значно збільшився за останні роки, оскільки Пекін посилив свою позицію.

Крім того, хоча колись вважалося, що Китай має перевагу з точки зору кількості даних, пан Лу зазначив, що зараз країна стикається з дефіцитом якісних даних, необхідних для навчання нових моделей, а також з проблемою обмеженого доступу до передових чіпів.

Нестача талантів є ще однією проблемою, на думку керівників IDC, оскільки найкращим і найяскравішим фахівцям у сфері штучного інтелекту часто легше досягти успіху, працюючи на провідних гравців у США. Наприклад, у OpenAI технічні експерти з Китаю складають основну групу. З 1677 учасників OpenAI у LinkedIn 23 навчалися в Університеті Цінхуа.

Однак, навіть за наявності достатньої кількості талантів, експерти ставлять під сумнів, наскільки далеко може зайти власний штучний інтелект Китаю, стикаючись з існуючими обмеженнями, спричиненими торговельною напруженістю між США та Китаєм.

У своєму звіті Ping An Securities попередила, що подальші зусилля щодо обмеження експорту чіпів зі США можуть прискорити розвиток китайської індустрії чіпів штучного інтелекту, але «вітчизняні альтернативи можуть не виправдати очікувань».

Вашингтон заблокував китайським компаніям доступ до найсучасніших напівпровідників у світі. У жовтні 2023 року США знову посилили правила, заблокувавши материковий доступ до графічних процесорів, які Nvidia розробила спеціально для китайських клієнтів, щоб уникнути попередніх обмежень.

Олександр Харроуелл, аналітик з передових обчислень у дослідницькій та консалтинговій групі Omdia, зазначає, що Китай має інші варіанти, окрім графічних процесорів, для навчання з магістра права (LLM), такі як TPU від Google, Ascend від Huawei, Trainium від AWS або одна з пропозицій низки стартапів. Однак це вимагатиме більше зусиль у розробці програмного забезпечення та системному адмініструванні.

За словами підприємця Сю, китайський ринок матиме особливі можливості, коли будуть опубліковані технічні звіти про Sora та модель відео з відкритим кодом. «Там буде платформа, на якій китайські компанії зможуть навчатися», – сказав він. Місцеві моделі відео також краще підтримують китайську мову, додав він.

(За даними SCMP)