
На заході Google I/O 2025 компанія Google шокувала світ технологій, представивши свою модель створення відео на основі штучного інтелекту під назвою Veo 3, що стало важливим кроком вперед для технологічного гіганта у вкрай суперечливій галузі.
За словами репортерки The Verge Еллісон Джонсон, найскладнішим аспектом Veo 3 є її здатність створювати оригінальний звук для кожного відео, від звукових ефектів і фонового шуму до діалогів персонажів.
«Veo 3 вразила мене як машина, яка створює абсолютно «сміттєвий» контент зі штучним інтелектом», – прокоментував репортер The Verge .
Нові можливості та вражаючий рівень реалізму.
«Ми вступаємо в нову еру творчості», – пояснив Джош Вудворд, віцепрезидент Google Gemini, у своїй презентації запуску Veo 3, підкресливши його здатність створювати «надзвичайно реалістичне» відео.
Спочатку Джонсон поставилася до цього скептично, але після особистого випробування інструменту штучного інтелекту вона підтвердила, що Вудворд не перебільшує. Veo 3 здатний створювати лякаюче реалістичні продукти.
Зокрема, репортер видання The Verge спробував створити короткий відеоролик, у якому ведучий новин оголошує про пожежу. Кліп був неймовірно переконливим, зі звуком та візуальними ефектами, подібними до будь-якої традиційної новинної трансляції.
![]() |
Кадр з відео, створеного Veo 3. Фото: The Verge. |
Невдовзі після цього пост, який містив серію відео за участю персонажів, створених за допомогою штучного інтелекту, які протестують проти команд, використаних для створення відео на основі штучного інтелекту, зібрав 50 000 лайків на Reddit. Серед сцен були катастрофа, жінка, що лежить на лікарняному ліжку з дихальною трубкою, та персонаж, якому погрожують пістолетом — і все це з розмовними діалогами та реалістичними фоновими звуками.
Порівняно з іншими інструментами для створення відео на основі штучного інтелекту, Veo 3 значно спростив роботу. Все, що потрібно, це проста команда, кілька хвилин для обробки платформою та підписка на тарифний план Google AI Ultra ( $249,99 на місяць).
Джонсону навіть стало легше створювати відео за допомогою менш специфічних команд, і це доводить одне: Veo 3 чудово справляється зі створенням контенту YouTube з найменшим спільним знаменником для дітей.
Кінець «ери німого кіно»
На сьогоднішній день жодна модель створення відео на основі штучного інтелекту не змогла одночасно забезпечити синхронізований звук або будь-який тип звуку для супроводу відеовиходу. Однак Veo 3 – завдяки своїй здатності створювати синхронізований звук – прагне покласти край «ері німого кіно».
«Ми виходимо з мовчазної ери створення відео», – заявив генеральний директор Google DeepMind Деміс Хассабіс на прес-конференції.
Широка доступність інструментів для створення відео-програм призвела до вибухового зростання постачальників, настільки, що цей простір стає перенасиченим.
Від стартапів, таких як Runway, Lightricks, Genmo, Pika, Higgsfield, Kling та Luma, до технологічних гігантів, таких як OpenAI та Alibaba, моделі випускаються швидкими темпами. У багатьох випадках між цими моделями мало різниці.
Залишається незрозумілим, чи зможе Veo 3 перевершити OpenAI Sora за якістю відео. Однак сама можливість експортувати повністю готові відеокліпи як із зображенням, так і зі звуком може одразу зробити Veo 3 більш привабливою платформою.
![]() |
Найвидатнішою особливістю Veo 3 є його здатність створювати «ідеально» синхронізоване аудіо з відео. Зображення: Google. |
«У світі кіно та телебачення фоновий шум і звукові ефекти зазвичай є роботою художників. А тепер уявіть, що все, що вам потрібно зробити, це описати Veo звук, який ви хочете бачити на задньому плані та пов’язати з дією, і він виведе все, включаючи відео та діалоги. Це робота, на яку аніматорам знадобилися б тижні або місяці», – прокоментував Джонсон.
Якщо Veo 3 справді може виконувати команди та видавати години стабільного відео та аудіо, то незабаром ми матимемо перший анімаційний фільм, створений повністю за допомогою штучного інтелекту.
Відразу після виходу Veo 3 творці почали ділитися кліпами на таких платформах, як X, зокрема, стендап-комічним відео, повністю створеним штучним інтелектом. Глядачі були здивовані, дізнавшись, що вся сцена, включаючи озвучку, відео та навіть звуки аудиторії, була згенерована за допомогою однієї письмової команди.
Потім вірусним став ще один кліп, у якому Піфагор відтворює пояснення своєї відомої теореми, доповнений стародавнім антуражем та точними діалогами. Був навіть музичний кліп, повністю створений Veo 3, де візуальні ефекти та музика були ідеально синхронізовані.
Газета «Економічний час» зазначила, що цей тип технологій можна назвати «новою ерою кіновиробництва», оскільки він дозволяє будь-кому — від окремих творців до великих медіастудій — створювати професійний контент за низькою ціною та з мінімальними ресурсами.
Джерело: https://znews.vn/ac-mong-tu-ai-tao-video-moi-cua-google-post1556018.html








Коментар (0)