Китайская компания запускает ИИ для создания поддельных видеороликов, которые выглядят точь-в-точь как настоящие

(Дэн Три) - ByteDance, материнская компания TikTok, удивила всех, представив инструмент искусственного интеллекта, способный создавать видеоролики с реалистичным содержанием.

ByteDance, технологическая компания, стоящая за социальной сетью TikTok, только что представила новую модель искусственного интеллекта (ИИ) под названием OmniHuman-1, способную создавать реалистичные анимированные видеоролики.

ByteDance утверждает, что OmniHuman-1 основан на технологии deepfake, которая позволяет создавать видео с чрезвычайно плавными движениями и которую очень сложно распознать как продукт искусственного интеллекта. ByteDance уверенно заявляет, что её инструмент ИИ способен создавать продукты более высокого качества по сравнению с другими существующими инструментами для создания видео на базе ИИ.

Видеозапись выступления Альберта Эйнштейна, созданная OmniHuman-1 на основе изображения ученого (Видео: ByteDance).

По словам исследователей ByteDance, OmniHuman-1 достаточно одного изображения и звука в качестве образца, например, голоса случайного человека или голоса певца. На основе этих данных ИИ-движок может генерировать видео любой длительности, в которых голос или голос певца будут идентичны аудиообразцу.

OmniHuman-1 также может редактировать и изменять существующие видео, изменяя содержание исходного видео.

Кроме того, OmniHuman-1 также позволяет пользователям создавать новые видеоролики с использованием различных визуальных и аудиостилей, например, анимированные видеоролики, кинематографические стили или реалистичные видеоролики.

Видео создано OmniHuman-1 по запросу пользователя (Видео: ByteDance).

Пользователям нужно только указать требования к соотношению сторон, соотношению тел (портрет, половина тела, все тело или все в одном), этот инструмент ИИ может создавать видеоролики с максимальной достоверностью, включая движения, освещение, окружающие детали...

ByteDance пока официально не представила OmniHuman-1 публике, но компания поделилась образцами видеороликов, созданных с помощью этого инструмента.

На основе изображения Альберта Эйнштейна, на котором знаменитый ученый выступает с речью, был создан 23-секундный видеоролик с реалистичными движениями лица и губ.

Несколько других коротких видеороликов, созданных OmniHuman-1, показывают людей с реалистичными жестами и выражениями лиц.

Видео с презентациями персонажей, созданное OmniHuman-1 из статичных изображений (Видео: ByteDance).

Демонстрационные видеоролики возможностей OmniHuman-1 вызвали восхищение в интернет-сообществе и технологическом сообществе, многие признали, что это самое реалистичное фейковое видео, которое они когда-либо видели.

Исследователи ByteDance заявили, что им удалось создать модель искусственного интеллекта, способную объединять данные из изображений, видео и аудио для создания реалистичных видеороликов с пропорциями лица, телом, мимикой, действиями, максимально приближенными к человеческим.

Исследовательская группа заявила, что видеоролики, созданные с помощью ИИ, имеют естественные лица, движения головы, жесты... которые соответствуют окружающим звукам и сценам, что помогает повысить «реализм» видеороликов.

ByteDance пока не сообщила, когда OmniHuman-1 станет доступен пользователям.

Видео создано OmniHuman-1 из изображений, на котором пейзаж за окном поезда реалистично меняется (Видео: ByteDance).

Появление OmniHuman-1 демонстрирует невероятные возможности инструментов искусственного интеллекта, разработанных в Китае, однако многие обеспокоены тем, что OmniHuman-1 может быть использован в вредоносных целях, например, для создания поддельных видеороликов знаменитостей с целью распространения ложной информации, мошенничества или даже создания поддельных порнографических видеороликов с целью шантажа.

Гонка разработок искусственного интеллекта между США и Китаем становится все более напряженной, поскольку эти две сверхдержавы постоянно внедряют инструменты искусственного интеллекта с превосходными характеристиками, чтобы побеждать своих оппонентов.

Несколько дней назад OpenAI также интегрировала новую функцию в ChatGPT, позволяющую инструменту составлять отчеты на основе огромного объема данных всего за несколько минут — задача, на выполнение которой у людей ушли бы часы.

Deepfake — это технология искусственного интеллекта, которая использует методы синтеза изображений человека для объединения и наложения изображения его лица на видео или изображение другого человека.

Дипфейк проходит «процесс обучения», основанный на входных данных, создавая модели и выбирая подходящие алгоритмы для непрерывной обработки и обучения на основе этих моделей. После периода «обучения» дипфейк способен сшивать лица с высокой точностью, которую сложно распознать невооруженным глазом.

Источник: https://dantri.com.vn/suc-manh-so/cong-ty-trung-quoc-ra-mat-ai-tao-video-gia-mao-giong-het-nhu-that-20250206125927906.htm