(Дэн Три) - ByteDance, материнская компания TikTok, удивила всех, представив инструмент искусственного интеллекта, способный создавать видеоролики с реалистичным содержанием.
ByteDance, технологическая компания, стоящая за социальной сетью TikTok, только что представила новую модель искусственного интеллекта (ИИ) под названием OmniHuman-1, способную создавать реалистичные анимированные видеоролики.
ByteDance утверждает, что OmniHuman-1 основан на технологии deepfake, которая позволяет создавать видео с чрезвычайно плавными движениями и которую очень сложно распознать как продукт искусственного интеллекта. ByteDance уверенно заявляет, что её инструмент ИИ способен создавать продукты более высокого качества по сравнению с другими существующими инструментами для создания видео на базе ИИ.
Видеозапись выступления Альберта Эйнштейна, созданная OmniHuman-1 на основе изображения ученого (Видео: ByteDance).
По словам исследователей ByteDance, OmniHuman-1 достаточно одного изображения и звука в качестве образца, например, голоса случайного человека или голоса певца. На основе этих данных ИИ-движок может генерировать видео любой длительности, в которых голос или голос певца будут идентичны аудиообразцу.
OmniHuman-1 также может редактировать и изменять существующие видео, изменяя содержание исходного видео.
Кроме того, OmniHuman-1 также позволяет пользователям создавать новые видеоролики с использованием различных визуальных и аудиостилей, например, анимированные видеоролики, кинематографические стили или реалистичные видеоролики.
Видео создано OmniHuman-1 по запросу пользователя (Видео: ByteDance).
Пользователям нужно только указать требования к соотношению сторон, соотношению тел (портрет, половина тела, все тело или все в одном), этот инструмент ИИ может создавать видеоролики с максимальной достоверностью, включая движения, освещение, окружающие детали...
ByteDance пока официально не представила OmniHuman-1 публике, но компания поделилась образцами видеороликов, созданных с помощью этого инструмента.
На основе изображения Альберта Эйнштейна, на котором знаменитый ученый выступает с речью, был создан 23-секундный видеоролик с реалистичными движениями лица и губ.
Несколько других коротких видеороликов, созданных OmniHuman-1, показывают людей с реалистичными жестами и выражениями лиц.
Видео с презентациями персонажей, созданное OmniHuman-1 из статичных изображений (Видео: ByteDance).
Демонстрационные видеоролики возможностей OmniHuman-1 вызвали восхищение в интернет-сообществе и технологическом сообществе, многие признали, что это самое реалистичное фейковое видео, которое они когда-либо видели.
Исследователи ByteDance заявили, что им удалось создать модель искусственного интеллекта, способную объединять данные из изображений, видео и аудио для создания реалистичных видеороликов с пропорциями лица, телом, мимикой, действиями, максимально приближенными к человеческим.
Исследовательская группа заявила, что видеоролики, созданные с помощью ИИ, имеют естественные лица, движения головы, жесты... которые соответствуют окружающим звукам и сценам, что помогает повысить «реализм» видеороликов.
ByteDance пока не сообщила, когда OmniHuman-1 станет доступен пользователям.
Видео создано OmniHuman-1 из изображений, на котором пейзаж за окном поезда реалистично меняется (Видео: ByteDance).
Появление OmniHuman-1 демонстрирует невероятные возможности инструментов искусственного интеллекта, разработанных в Китае, однако многие обеспокоены тем, что OmniHuman-1 может быть использован в вредоносных целях, например, для создания поддельных видеороликов знаменитостей с целью распространения ложной информации, мошенничества или даже создания поддельных порнографических видеороликов с целью шантажа.
Гонка разработок искусственного интеллекта между США и Китаем становится все более напряженной, поскольку эти две сверхдержавы постоянно внедряют инструменты искусственного интеллекта с превосходными характеристиками, чтобы побеждать своих оппонентов.
Несколько дней назад OpenAI также интегрировала новую функцию в ChatGPT, позволяющую инструменту составлять отчеты на основе огромного объема данных всего за несколько минут — задача, на выполнение которой у людей ушли бы часы.
Deepfake — это технология искусственного интеллекта, которая использует методы синтеза изображений человека для объединения и наложения изображения его лица на видео или изображение другого человека.
Дипфейк проходит «процесс обучения», основанный на входных данных, создавая модели и выбирая подходящие алгоритмы для непрерывной обработки и обучения на основе этих моделей. После периода «обучения» дипфейк способен сшивать лица с высокой точностью, которую сложно распознать невооруженным глазом.
Источник: https://dantri.com.vn/suc-manh-so/cong-ty-trung-quoc-ra-mat-ai-tao-video-gia-mao-giong-het-nhu-that-20250206125927906.htm
Комментарий (0)