
На мероприятии Google I/O 2025 компания Google потрясла мир технологий, представив модель искусственного интеллекта для генерации видео под названием Veo 3, что стало большим шагом вперед для технологического гиганта в спорной области.
По словам репортера The Verge Эллисон Джонсон, самой сложной особенностью Veo 3 является его способность создавать оригинальный звук для каждого видео: от звуковых эффектов и фонового шума до диалогов персонажей.
«Veo 3 показался мне абсолютно «мусорной» машиной по генерации контента на основе искусственного интеллекта», — прокомментировал репортер The Verge .
Новые возможности и шокирующий реализм
«Мы вступаем в новую эру творчества», — объяснил вице-президент Gemini компании Google Джош Вудворд во время презентации Veo 3, подчеркнув возможность создания «сверхреалистичных» видеороликов.
Джонсон поначалу отнеслась к этому скептически, но после того, как сама опробовала инструмент искусственного интеллекта, она убедилась, что Вудворд не преувеличивает. Veo 3 способен создавать ужасающе реалистичные продукты.
В частности, репортер The Verge попытался создать короткометражный видеоролик с содержанием сообщения ведущего новостей о пожаре. Клип невероятно убедителен, его качество звука и декорации напоминают любую традиционную новостную передачу.
![]() |
Сцена из видео, созданного Veo 3. Фото: The Verge. |
Вскоре после этого пост, включающий серию видеороликов с персонажами, созданными искусственным интеллектом и протестующими против команд, используемых для создания видеороликов, набрал 50 000 лайков на Reddit. В сценах присутствуют катастрофы, женщина, лежащая на больничной койке с дыхательной трубкой, и персонаж, которому угрожают пистолетом, — все это сопровождается разговорными диалогами и реалистичными фоновыми звуками.
По сравнению с другими инструментами искусственного интеллекта для создания видео Veo 3 значительно упростил процесс. Все, что нужно, — это простая команда, несколько минут ожидания обработки платформой и подписка на тарифный план AI Ultra от Google ( 249,99 долл. США в месяц).
Джонсону было еще проще создавать видео, используя менее специфические команды, и это указывало на одно: Veo 3 отлично справляется с созданием самого простого типа контента YouTube для детей.
Конец «эпохи немого кино»
На сегодняшний день ни одна модель генерации видео на основе ИИ не способна одновременно обеспечивать синхронизированный звук или какой-либо другой вид звука, сопровождающего видеовыход. Однако Veo 3, обладающий способностью создавать синхронизированный звук, стремится положить конец «эре немого кино».
«Мы выходим из эпохи молчаливого создания видео», — заявил на пресс-конференции генеральный директор Google DeepMind Демис Хассабис.
Широкая доступность инструментов для создания видео привела к взрывному росту числа поставщиков, в результате чего рынок стал перенасыщен.
От таких стартапов, как Runway, Lightricks, Genmo, Pika, Higgsfield, Kling и Luma, до таких технологических гигантов, как OpenAI и Alibaba, модели выпускаются быстрыми темпами. Во многих случаях между этими моделями существует очень мало различий.
Еще неизвестно, сможет ли Veo 3 превзойти OpenAI Sora по качеству видео. Тем не менее, возможность экспортировать полностью готовые видеоролики со звуком и видео могла бы мгновенно сделать Veo 3 более привлекательной платформой.
![]() |
Самой выдающейся особенностью Veo 3 является его способность создавать звук, «идеально» синхронизированный с видео. Фото: Google. |
«В мире кино и телевидения фоновый шум и звуковые эффекты часто являются работой художников. А теперь представьте, если бы вам нужно было просто описать Veo звук, который вы хотите использовать на заднем плане и прикрепить к действию, и он бы вывел все это, включая видео и диалоги. Это работа, на которую аниматоры тратили бы недели или месяцы», — прокомментировал Джонсон.
Если Veo 3 действительно сможет выполнять команды и выводить часы последовательного видео и звука, то совсем скоро мы увидим первый анимационный фильм, созданный полностью с помощью ИИ.
Вскоре после запуска Veo 3 создатели начали делиться клипами на таких платформах, как X, где было представлено стендап-комедийное видео, созданное полностью с помощью ИИ. Зрители были удивлены, узнав, что вся сцена, включая голос, видео и даже звук аудитории, была создана всего лишь с помощью одной команды текстового описания.
Затем в сети стал вирусным еще один клип, в котором была представлена инсценировка объяснения Пифагором своей знаменитой теоремы, дополненная древним контекстом и точными диалогами. Есть даже музыкальный клип, полностью созданный Veo 3, в котором визуальные эффекты и музыка идеально синхронизированы.
Economic Times отметила, что этот тип технологий можно назвать «новой эрой кинопроизводства», позволяющей любому человеку — от отдельных создателей до крупных медиастудий — производить профессиональный контент с низкими затратами и минимальными ресурсами.
Источник: https://znews.vn/ac-mong-tu-ai-tao-video-moi-cua-google-post1556018.html
Комментарий (0)