
На заході Google I/O 2025 компанія Google шокувала світ технологій, представивши модель штучного інтелекту Veo 3, що генерує відео , що стало великим кроком вперед для технологічного гіганта в суперечливій галузі.
За словами репортерки The Verge Еллісон Джонсон, найдосконаліша річ у Veo 3 — це її здатність створювати оригінальний звук для кожного відео, від звукових ефектів і фонового шуму до навіть діалогів персонажів.
«Veo 3 вражає мене як абсолютно «сміттєва» машина для створення контенту на основі штучного інтелекту», – прокоментував репортер The Verge .
Нові можливості та вражаючий реалізм
«Ми вступаємо в нову еру творчості», – пояснив віце-президент Google з питань Gemini Джош Вудворд під час основної доповіді на презентації Veo 3, наголосивши на можливості створення «ультрареалістичних» відео.
Спочатку Джонсон поставилася до цього скептично, але після того, як вона сама випробувала інструмент штучного інтелекту, вона переконалася, що Вудворд не перебільшує. Veo 3 здатний створювати продукти, які є лякаюче реалістичними.
Зокрема, репортер The Verge спробував створити короткий відеоролик зі змістом ведучого новин, який оголошує про пожежу. Кліп надзвичайно переконливий, з якістю звуку та пейзажами, подібними до будь-якого традиційного новинного репортажу.
![]() |
Кадр з відео, створеного Veo 3. Фото: The Verge. |
Публікація, яка містила серію відео за участю персонажів, створених штучним інтелектом, які протестують проти команд, використаних для створення цих відео, з того часу набрала 50 000 голосів на Reddit. Серед сцен є катастрофа, жінка, що лежить на лікарняному ліжку підключена до апарату штучної вентиляції легень, та персонаж, якому погрожують пістолетом — і все це з розмовними діалогами та реалістичними фоновими звуками.
Порівняно з іншими інструментами для створення відео на основі штучного інтелекту, Veo 3 значно спростив роботу. Все, що потрібно, це проста команда, кілька хвилин очікування на обробку платформою та підписка на тарифний план Google AI Ultra ( $249,99 на місяць).
Джонсону було ще легше створювати відео, використовуючи менш специфічні команди, і це вказувало на одне: Veo 3 чудово справляється зі створенням контенту YouTube для дітей з найменшим спільним знаменником.
Кінець «ери німого кіно»
На сьогоднішній день жодна модель генерації відео на основі штучного інтелекту не змогла одночасно забезпечити синхронізований звук, або взагалі будь-який звук, який супроводжуватиме відеовихід. Однак Veo 3 – завдяки своїм можливостям синхронізованої генерації звуку – прагне покласти край «ері безшумного звуку».
«Ми виходимо з мовчазної ери створення відео», – заявив генеральний директор Google DeepMind Деміс Хассабіс під час прес-конференції.
Широка доступність інструментів для створення відео призвела до вибухового зростання постачальників, настільки, що простір стає перенасиченим.
Від стартапів, таких як Runway, Lightricks, Genmo, Pika, Higgsfield, Kling та Luma, до технологічних гігантів, таких як OpenAI та Alibaba, моделі випускаються швидкими темпами. У багатьох випадках між цими моделями мало різниці.
Залишається з'ясувати, чи зможе Veo 3 перевершити OpenAI Sora за якістю відео, але можливість виводити повністю готові відео як з аудіо, так і з відео може одразу зробити Veo 3 більш привабливою платформою.
![]() |
Найвидатнішою особливістю Veo 3 є його здатність створювати звук, «ідеально» синхронізований з відео. Фото: Google. |
«У світі кіно та телебачення фоновий шум і звукові ефекти часто є роботою художників. А тепер уявіть, що все, що вам потрібно зробити, це описати Veo звук, який ви хочете бачити на задньому плані та додавати до дії, і він виведе все це, включаючи відео та діалоги. Це робота, на яку аніматори витрачали б тижні або місяці», – прокоментував Джонсон.
Якщо Veo 3 дійсно може виконувати команди та видавати години послідовного відео та аудіо, то незабаром ми матимемо перший анімаційний фільм, створений повністю за допомогою штучного інтелекту.
Невдовзі після запуску Veo 3, творці почали ділитися кліпами на таких платформах, як X, зокрема стендап-комедійним відео, повністю створеним за допомогою штучного інтелекту. Глядачі були вражені, дізнавшись, що вся сцена, включаючи голос, відео та навіть аудіозапис аудиторії, була створена лише з текстового опису.
Також є ще один вірусний кліп, який відтворює пояснення Піфагора його відомої теореми, доповнений античним контекстом і точними діалогами. Є навіть музичний кліп, повністю створений Veo 3, де візуальні ефекти та музика ідеально синхронізовані.
Газета «Економічний час» зазначила, що цей тип технологій можна назвати «новою ерою кіновиробництва», дозволяючи будь-кому – від окремих творців до великих медіастудій – створювати професійний контент за низькою ціною та з мінімальними ресурсами.
Джерело: https://znews.vn/ac-mong-tu-ai-tao-video-moi-cua-google-post1556018.html
Коментар (0)