Google — одна из технологических корпораций, активно участвующих в разработке инструментов искусственного интеллекта (ИИ), включая чат-бота Gemini, конкурирующего с ChatGPT, и инструмент для создания текстовых изображений Imagen. Однако возможности Google по созданию видео на основе описательного текста по-прежнему считаются технологическим сообществом значительно уступающими конкурентам.
Недавно Google официально представила инструмент Gemini Advanced для поддержки пользователей, позволяющий конвертировать текст в видео высокого разрешения длительностью 8 секунд. Кроме того, была реализована функция Whisk Animate, позволяющая превращать статичные изображения в яркие анимированные видеоролики аналогичной длительности. Обе эти функции теперь доступны пользователям, оформившим подписку Google One AI Premium.
По словам Google, Veo 2 — это шаг вперёд в создании видео, разработанный для создания высококачественных, детализированных, реалистичных и кинематографичных видеороликов. Veo 2, воспроизводя реальную физику и движения человека, позволяет создавать плавные движения персонажей, динамичные сцены и изысканные детали в широком диапазоне сюжетов и стилей.
Чтобы создать видео, пользователям необходимо выбрать Veo 2 в меню моделей Gemini (расположение этой опции в интерфейсе может измениться в процессе разработки). Эта функция создаст 8-секундный видеоролик с разрешением 720p, экспортированный в формате MP4 с соотношением сторон 16:9 в альбомной ориентации. Google также отмечает, что пользователи ограничены количеством создаваемых ими видеороликов в месяц.
Пользователи просто описывают сцену, которую они представляют, будь то короткий рассказ, визуальная идея или конкретная сцена. Затем Gemini воплощает эти идеи в жизнь. Чем подробнее описание, тем лучше будет финальное видео.
Google заявляет, что пользователи могут легко делиться видео, созданными с помощью Veo 2, в социальных сетях, таких как TikTok или YouTube Shorts. Однако видео, созданные с помощью Veo 2, имеют соотношение сторон 16:9, что совершенно не подходит для публикации на этих видеоплатформах.

Функция создания видео уже доступна пользователям Gemini Advanced по всему миру как в веб-версии, так и на мобильных устройствах. Однако она доступна только владельцам тарифного плана Google One AI Premium, при этом в Gemini доступна полная языковая поддержка.
В настоящее время Veo 2 предоставляется Google пользователям Gemini Advanced по цене 489 000 донгов в месяц во Вьетнаме.
Помимо Veo 2, Google также запустила инструмент искусственного интеллекта под названием Whisk Animate, который позволяет пользователям создавать новые изображения с описательным текстом, а затем превращать это изображение в видео с плавным движением. Однако его максимальная продолжительность, как и в Veo 2, составляет всего 8 секунд.
Whisk, экспериментальный проект Google Labs, запуск которого запланирован на конец 2024 года, помогает пользователям быстро исследовать и визуализировать новые идеи с помощью текстовых и графических подсказок. Функция Whisk Animate позволяет воплотить свои идеи в жизнь.
Whisk Animate позволяет превращать фотографии пользователей в живые 8-секундные видеоролики с помощью технологии Veo 2. Эта функция доступна подписчикам Google One AI Premium более чем в 60 странах.

Google также заявила, что предприняла значительные шаги для обеспечения безопасности создания видео. Это включает в себя предотвращение создания контента, нарушающего политику Google, и тщательную проверку. Кроме того, каждое видео, созданное с помощью Veo 2, помечается SynthID — цифровым водяным знаком, встроенным в каждый кадр, который чётко указывает на то, что видео создано с помощью искусственного интеллекта.
Источник: https://www.vietnamplus.vn/google-gioi-thieu-cong-cu-ai-chuyen-doi-van-ban-thanh-video-tu-gemini-advanced-post1033671.vnp
Комментарий (0)