
Na akci Google I/O 2025 šokoval Google technologický svět, když představil model umělé inteligence generující video s názvem Veo 3, což pro technologického giganta znamenalo velký krok vpřed v kontroverzní oblasti.
Podle zkušeností reportérky The Verge Allison Johnsonové je nejsofistikovanější věcí na Veo 3 jeho schopnost vytvářet originální zvuk pro každé video, od zvukových efektů, šumu na pozadí až po dialogy postav.
„Veo 3 mi připadá jako naprosto ‚odpadkový‘ stroj na generování obsahu s umělou inteligencí,“ komentoval to reportér The Verge .
Nové funkce a šokující realismus
„Vstupujeme do nové éry kreativity,“ vysvětlil viceprezident Googlu pro Gemini Josh Woodward během úvodního projevu k uvedení Veo 3 a zdůraznil schopnost vytvářet „ultrarealistická“ videa.
Johnsonová byla zpočátku skeptická, ale poté, co si nástroj umělé inteligence vyzkoušela na vlastní kůži, se přesvědčila, že Woodward nepřehání. Veo 3 dokáže vytvářet produkty, které jsou děsivě realistické.
Konkrétně se reportér deníku The Verge pokusil vytvořit krátké video s obsahem, v němž moderátor zpráv oznamuje požár. Klip je mimořádně přesvědčivý, s kvalitou zvuku a scenérií podobnou jakékoli tradiční zpravodajské reportáži.
![]() |
Scéna z videa vytvořeného Veo 3. Foto: The Verge. |
Příspěvek, který obsahoval sérii videí s postavami generovanými umělou inteligencí, které protestují proti příkazům použitým k vytvoření těchto videí, od té doby nasbíral na Redditu 50 000 hlasů. Mezi scénami je katastrofa, žena ležící v nemocniční posteli na ventilátoru a postava, které je vyhrožována zbraní – to vše doplněno mluveným dialogem a realistickými zvuky na pozadí.
Ve srovnání s jinými nástroji pro tvorbu videa s umělou inteligencí je Veo 3 mnohem jednodušší. Stačí základní příkaz, pár minut čekání na zpracování platformou a předplatné tarifu Google AI Ultra ( 249,99 dolarů měsíčně).
Pro Johnsona bylo ještě snazší vytvářet videa pomocí méně specifických příkazů, což naznačovalo jednu věc: Veo 3 vyniká ve vytváření obsahu na YouTube pro děti s nejnižším společným jmenovatelem.
Konec „éry němého filmu“
Dosud žádný model pro generování videa s umělou inteligencí nebyl schopen současně poskytovat synchronizovaný zvuk, nebo vůbec jakýkoli zvuk, který by doprovázel video výstup. Veo 3 – se svými možnostmi synchronizovaného generování zvuku – se však snaží ukončit „tichou éru“.
„Opouštíme tichou éru tvorby videa,“ řekl na tiskové konferenci generální ředitel společnosti Google DeepMind Demis Hassabis.
Široká dostupnost nástrojů pro tvorbu videí vedla k explozi dodavatelů do té míry, že se tento prostor stává nasyceným.
Od startupů jako Runway, Lightricks, Genmo, Pika, Higgsfield, Kling a Luma až po technologické giganty jako OpenAI a Alibaba, modely jsou vydávány rychlým tempem. V mnoha případech je mezi těmito modely jen malý rozdíl.
Zda se Veo 3 podaří překonat OpenAI Sora v kvalitě videa, se teprve uvidí, ale schopnost produkovat plně produkovaná videa se zvukem i obrazem by mohla Veo 3 okamžitě učinit přesvědčivější platformou.
![]() |
Nejvýraznější vlastností Veo 3 je jeho schopnost vytvářet zvuk v „dokonalé“ synchronizaci s videem. Foto: Google. |
„Ve světě filmu a televize jsou hluk na pozadí a zvukové efekty často dílem umělců. Představte si, že byste Veovi stačilo popsat zvuk, který chcete mít v pozadí a připojit k akci, a on by vám vygeneroval vše, včetně videa a dialogů. To je práce, kterou by animátoři dělali týdny nebo měsíce,“ poznamenal Johnson.
Pokud Veo 3 skutečně dokáže plnit příkazy a produkovat hodiny konzistentního videa a zvuku, nebude trvat dlouho a budeme mít první animovaný celovečerní film vytvořený výhradně s využitím umělé inteligence.
Brzy po spuštění Veo 3 začali tvůrci sdílet klipy na platformách jako X, včetně stand-up comedy videa vytvořeného výhradně s využitím umělé inteligence. Diváci byli ohromeni, když zjistili, že celá scéna, včetně hlasu, videa a dokonce i zvuku publika, byla vytvořena pouze z textového popisu.
Pak je tu další virální klip, který znovu zobrazuje Pythagora, jak vysvětluje svou slavnou větu, doplněný starověkým kontextem a přesnými dialogy. Dokonce existuje i hudební video, které kompletně natočilo studio Veo 3, kde jsou vizuální stránka a hudba v dokonalé synchronizaci.
List Economic Times poznamenal, že tento typ technologie by se dal nazvat „novou érou filmové tvorby“, která umožňuje komukoli – od jednotlivých tvůrců až po velká mediální studia – produkovat profesionální obsah s nízkými náklady a s minimálními zdroji.
Zdroj: https://znews.vn/ac-mong-tu-ai-tao-video-moi-cua-google-post1556018.html
Komentář (0)