Всего несколько лет назад Китай представлял себе, что в конечном итоге станет лидером в мировой гонке искусственного интеллекта, используя обширные данные страны для разработки таких приложений, как распознавание лиц.
Недавние разработки в области генеративного искусственного интеллекта — использование крупных моделей для создания такого контента, как текст, изображения и видео — изменили баланс, в результате чего Китай снова оказался отстающим.
Запуск Sora 16 февраля совпал с растущей проблемой для Китая, связанной с потерей доступа к передовым графическим процессорам Nvidia из-за ужесточения экспортных ограничений в США. Лучшие китайские специалисты по искусственному интеллекту отстают от зарубежных коллег на несколько лет.
Чжоу Хунъи, основатель компании 360 Security Technology, занимающейся интернет-безопасностью, назвал Sora «ведром холодной воды, вылитым на Китай», сообщило издание Yicai 23 февраля. Он сказал, что это помогло многим людям увидеть разрыв между ними и мировыми лидерами.
OpenAI ещё не выпустила Sora в открытый доступ. В отличие от некоторых своих предшественников, исходный код Sora не является открытым. Доступ к пробной версии Sora есть лишь у небольшого числа пользователей.
В Китае Национальное управление киберпространства требует, чтобы все публичные модели больших языков (LLM) были зарегистрированы в правительстве. Мировые гиганты, такие как OpenAI и Google, пока официально не предоставляют здесь свои услуги.
Это отсутствие привело к тому, что многие китайские технологические гиганты начали конкурировать за место на рынке, имея более 200 LLM. Baidu, Tencent и Alibaba также представили собственные LLM.
Однако немногие инструменты могут сравниться с Sora, отчасти потому, что они пока не используют новую архитектуру Diffusion Transformer (DiT). Материнская компания TikTok, ByteDance, заявляет, что её внутренний инструмент управления движением в видео Boximator, который она использует для создания видеороликов, всё ещё находится в зачаточном состоянии и не готов к массовому выпуску.
Компания признает, что между Boximator и ведущими моделями для создания видео существует большой разрыв с точки зрения качества изображения, точности и продолжительности.
Вместо того, чтобы догнать Сору, некоторые представители отрасли видят более насущную проблему в получении доступа к моделям OpenAI. Однако американские законодатели стремятся ограничить доступ Китая к своим облачным сервисам ИИ.
Неназванный китайский разработчик сообщил SCMP, что возможный путь для китайских инженеров ИИ — «сначала декодировать Sora и обучить его на собственных данных, чтобы создать аналогичный продукт». Сюй Лян, предприниматель в области ИИ из Ханчжоу, считает, что вскоре в Китае появятся аналогичные сервисы, хотя между китайскими продуктами и Sora всё ещё может оставаться небольшой разрыв.
Ван Шуйи, профессор, специализирующийся на искусственном интеллекте и машинном обучении в Тяньцзиньском педагогическом университете (TJNU), прокомментировал: опыт разработки LLM за последний год позволил китайским крупным технологическим компаниям накопить знания в этой области и создать необходимое оборудование, что позволит им производить такие продукты, как Sora, в течение следующих 6 месяцев.
За несколько месяцев до запуска Sora группа исследователей выпустила VBench — инструмент для сравнительного анализа моделей генерации видео. Команда VBench, в которую вошли исследователи из Наньянского технологического университета (Сингапур) и Шанхайской лаборатории искусственного интеллекта (Китай), обнаружила, что Sora превосходит другие модели по общему качеству видео, основываясь на демонстрационных материалах, предоставленных OpenAI.
Лу Янься, директор по исследованиям новых технологий в IDC China, заявил, что такие технологические гиганты, как Baidu, Alibaba и Tencent, будут одними из первых, кто запустит аналогичные сервисы в стране.
Кроме того, по ее словам, к гонке также присоединятся iFlyTek, SenseTime и Hikvision, которые все находятся в санкционном списке Вашингтона.
Однако, по словам аналитиков, Китаю по-прежнему предстоит нелегкая борьба, поскольку его технологический рынок становится все более изолированным от мира с точки зрения капитала, оборудования, данных и даже людей.
Разрыв в рыночной стоимости ведущих технологических компаний Китая и США, таких как Microsoft, Google и Nvidia, значительно увеличился за последние годы, поскольку Пекин усилил свой контроль.
Кроме того, хотя когда-то считалось, что Китай имеет преимущество с точки зрения количества данных, Лу отметил, что теперь страна сталкивается с нехваткой качественных данных, необходимых для обучения новых моделей, а также с проблемой ограниченного доступа к современным чипам.
По словам руководителей IDC, нехватка кадров — ещё одна проблема, поскольку лучшим и самым талантливым специалистам в области ИИ зачастую легче проявить себя, работая на ведущих игроков в США. Например, в OpenAI костяк составляют технические эксперты из Китая. Из 1677 участников OpenAI в LinkedIn 23 учились в Университете Цинхуа.
Однако даже при наличии достаточного количества талантливых специалистов эксперты сомневаются в том, насколько далеко может продвинуться китайский искусственный интеллект, учитывая существующие ограничения, связанные с торговой напряженностью между США и Китаем.
В своем отчете компания Ping An Securities предупредила, что продолжение усилий по ограничению экспорта чипов из США может ускорить развитие китайской индустрии чипов для ИИ, однако «отечественные альтернативы могут не оправдать ожиданий».
Вашингтон заблокировал китайским компаниям доступ к самым передовым в мире полупроводникам. В октябре 2023 года США вновь ужесточили правила, заблокировав доступ материковой части страны к графическим процессорам, разработанным Nvidia специально для китайских клиентов, чтобы обойти предыдущие ограничения.
Александр Харроуэлл, продвинутый аналитик в области вычислительных технологий из исследовательской и консалтинговой группы Omdia, отмечает, что в Китае есть варианты обучения на степень магистра права (LLM) помимо графических процессоров, такие как TPU от Google, Ascend от Huawei, Trainium от AWS и ряд других стартапов. Однако это потребует больших усилий в разработке программного обеспечения и системном администрировании.
По словам предпринимателя Сюй, у китайского рынка появятся особые возможности после публикации технических отчётов по Sora и модели видео с открытым исходным кодом. «Это будет платформа, на которой китайские компании смогут учиться», — сказал он. Он добавил, что местные модели видео также лучше поддерживают китайский рынок.
(По данным SCMP)
Источник
Комментарий (0)