
На мероприятии Google I/O 2025 компания Google потрясла технологический мир, представив модель искусственного интеллекта для генерации видео под названием Veo 3, что стало большим шагом вперед для технологического гиганта в спорной области.
По словам репортера The Verge Эллисон Джонсон, самой продвинутой особенностью Veo 3 является возможность создания оригинального звука для каждого видео: от звуковых эффектов и фонового шума до даже диалогов персонажей.
«Veo 3 показался мне абсолютно „мусорным“ генератором ИИ-контента», — прокомментировал репортер The Verge .
Новые возможности и шокирующий реализм
«Мы вступаем в новую эру творчества», — пояснил вице-президент Gemini компании Google Джош Вудворд в программной речи по запуску Veo 3, подчеркнув возможность создания «ультрареалистичного» видео.
Джонсон поначалу отнеслась к этому скептически, но, протестировав ИИ-инструмент лично, убедилась, что Вудворд не преувеличивает. Veo 3 способен создавать пугающе реалистичные продукты.
В частности, репортёр The Verge попытался создать короткий видеоролик с репортажем ведущего новостей о пожаре. Ролик получился крайне убедительным: качество звука и декорации напоминают любой традиционный новостной репортаж.
![]() |
Сцена из видео, созданного Veo 3. Фото: The Verge. |
Вскоре после этого пост, включающий серию видеороликов с персонажами, созданными искусственным интеллектом, протестующими против команд, используемых для создания этих видеороликов, набрал 50 000 лайков на Reddit. Среди сцен были катастрофа, женщина, лежащая на больничной койке на аппарате искусственной вентиляции лёгких, и персонаж, которому угрожают пистолетом, — всё это сопровождалось диалогами и реалистичными фоновыми звуками.
По сравнению с другими инструментами для создания видео на базе ИИ, Veo 3 значительно упрощает работу. Всё, что нужно, — это простая команда, несколько минут ожидания обработки платформой и подписка на тарифный план Google AI Ultra ( $249,99 в месяц).
Джонсону было еще проще создавать видео, используя менее специфические команды, и это указывало на одно: Veo 3 превосходно справляется с созданием самого простого типа YouTube-контента для детей.
Конец «эры немого кино»
На сегодняшний день ни одна модель генерации видео на основе ИИ не способна одновременно обеспечивать синхронизированный звук или вообще какой-либо звук, сопровождающий видеовыход. Однако Veo 3 с его возможностями синхронизированной генерации звука призван положить конец «эре молчания».
«Мы выходим из эпохи молчания в создании видео», — заявил на пресс-конференции генеральный директор Google DeepMind Демис Хассабис.
Широкая доступность инструментов для создания видео привела к взрывному росту числа поставщиков, в результате чего рынок стал перенасыщенным.
От таких стартапов, как Runway, Lightricks, Genmo, Pika, Higgsfield, Kling и Luma, до таких технологических гигантов, как OpenAI и Alibaba, модели выпускаются стремительными темпами. Во многих случаях между этими моделями практически нет разницы.
Пока не ясно, сможет ли Veo 3 превзойти OpenAI Sora по качеству видео, но возможность выводить полностью готовые видеоролики со звуком и видео может сразу сделать Veo 3 более привлекательной платформой.
![]() |
Самая выдающаяся особенность Veo 3 — это способность создавать звук, «идеально» синхронизированный с видео. Фото: Google. |
«В мире кино и телевидения фоновый шум и звуковые эффекты часто являются работой художников. А теперь представьте, что вам достаточно было бы просто описать Veo, какой звук вы хотите использовать на заднем плане и прикрепить к действию, и он бы всё это вывел, включая видео и диалоги. На эту работу у аниматоров уходят недели, а то и месяцы», — прокомментировал Джонсон.
Если Veo 3 действительно сможет выполнять команды и выводить часы стабильного видео и аудио, то пройдет совсем немного времени, прежде чем мы получим первый анимационный полнометражный фильм, созданный полностью с помощью ИИ.
Вскоре после запуска Veo 3 создатели начали делиться клипами на таких платформах, как X, включая стендап-комедийное видео, полностью созданное с помощью искусственного интеллекта. Зрители были поражены, узнав, что вся сцена, включая закадровый голос, видео и даже звук зрителей, была создана всего лишь из текстового описания.
А ещё есть вирусный ролик, воссоздающий объяснение Пифагором своей знаменитой теоремы, с древним контекстом и точными диалогами. Есть даже музыкальный клип, полностью созданный Veo 3, где визуальный ряд и музыка идеально синхронизированы.
Газета Economic Times отметила, что этот тип технологий можно назвать «новой эрой кинопроизводства», позволяющей любому человеку — от отдельных создателей до крупных медиастудий — производить профессиональный контент с низкими затратами и минимальными ресурсами.
Источник: https://znews.vn/ac-mong-tu-ai-tao-video-moi-cua-google-post1556018.html












Комментарий (0)