
Na akci Google I/O 2025 šokovala společnost Google technologický svět představením svého modelu pro tvorbu videa s využitím umělé inteligence s názvem Veo 3, což pro technologického giganta znamenalo významný krok vpřed ve velmi kontroverzní oblasti.
Podle reportérky The Verge Allison Johnsonové je nejsofistikovanějším aspektem Veo 3 jeho schopnost vytvářet originální zvuk pro každé video, od zvukových efektů a šumu na pozadí až po dialogy postav.
„Veo 3 na mě udělal dojem jako stroj, který naprosto vytváří ‚odpadkový‘ obsah s umělou inteligencí,“ komentoval to reportér z The Verge .
Nové funkce a šokující úroveň realismu.
„Vstupujeme do nové éry kreativity,“ vysvětlil Josh Woodward, viceprezident společnosti Google pro Gemini, ve své prezentaci k uvedení Veo 3 a zdůraznil jeho schopnost vytvářet „extrémně realistické“ video.
Johnsonová byla zpočátku skeptická, ale poté, co si nástroj umělé inteligence osobně vyzkoušela, potvrdila, že Woodward nepřehání. Veo 3 je schopen vytvářet děsivě realistické produkty.
Konkrétně se reportér z The Verge pokusil vytvořit krátké video moderátora zpráv oznamujícího požár. Klip byl neuvěřitelně přesvědčivý, se zvukem a vizuálním doprovodem podobným tradičnímu zpravodajskému vysílání.
![]() |
Scéna z videa vytvořeného Veo 3. Foto: The Verge. |
Brzy poté příspěvek, který obsahoval sérii videí s postavami generovanými umělou inteligencí protestujícími proti příkazům použitým k vytvoření videí s umělou inteligencí, získal na Redditu 50 000 lajků. Mezi scénami byla katastrofa, žena ležící na nemocničním lůžku s dýchací trubicí a postava, které je vyhrožováno zbraní – to vše s mluveným dialogem a realistickými zvuky na pozadí.
Ve srovnání s jinými nástroji pro tvorbu videa s umělou inteligencí to Veo 3 mnohem zjednodušil. Stačí základní příkaz, pár minut na zpracování platformou a předplatné tarifu AI Ultra od Googlu ( 249,99 dolarů měsíčně).
Johnson dokonce zjistil, že je snazší vytvářet videa pomocí méně specifických příkazů, což dokazuje jednu věc: Veo 3 vyniká ve vytváření obsahu na YouTube s nejnižším společným jmenovatelem pro děti.
Konec „éry němého filmu“
Žádný model pro tvorbu videa s umělou inteligencí dosud nebyl schopen současně poskytovat synchronizovaný zvuk ani žádný typ zvuku doprovázejícího video výstup. Veo 3 – se svou schopností vytvářet synchronizovaný zvuk – se však snaží ukončit „éru němého filmu“.
„Vynořujeme se z tiché éry tvorby videa,“ řekl na tiskové konferenci generální ředitel společnosti Google DeepMind Demis Hassabis.
Široká dostupnost nástrojů pro tvorbu videí vedla k explozi dodavatelů do té míry, že se tento prostor stává nasyceným.
Od startupů jako Runway, Lightricks, Genmo, Pika, Higgsfield, Kling a Luma až po technologické giganty jako OpenAI a Alibaba, modely jsou vydávány rychlým tempem. V mnoha případech je mezi těmito modely jen malý rozdíl.
Zatím není jasné, zda Veo 3 dokáže překonat OpenAI Sora v kvalitě videa. Nicméně samotná možnost exportovat plně produkované videoklipy s obrazem i zvukem by mohla Veo 3 okamžitě učinit atraktivnější platformou.
![]() |
Nejvýraznější vlastností Veo 3 je jeho schopnost vytvářet „dokonale“ synchronizovaný zvuk s videem. Obrázek: Google. |
„Ve světě filmu a televize jsou hluk na pozadí a zvukové efekty obvykle dílem umělců. Představte si, že byste Veovi stačilo popsat zvuk, který chcete v pozadí a svázat s akcí, a on by vyprodukoval vše, včetně videa a dialogů. To je práce, kterou by animátorům trvalo týdny nebo měsíce,“ poznamenal Johnson.
Pokud Veo 3 skutečně dokáže plnit příkazy a produkovat hodiny konzistentního videa a zvuku, nebude trvat dlouho a budeme mít první animovaný film vytvořený výhradně s využitím umělé inteligence.
Ihned po vydání Veo 3 začali tvůrci sdílet klipy na platformách jako X, zejména stand-up comedy video vytvořené výhradně pomocí umělé inteligence. Diváci byli překvapeni, když zjistili, že celá scéna, včetně dabingu, videa a dokonce i zvuků publika, byla vygenerována z jediného písemného příkazu.
Pak se virálně rozšířil další klip, který znovu ztvárňoval Pythagora, jak vysvětluje svou slavnou větu, doplněný starověkým prostředím a přesnými dialogy. Dokonce se objevilo i hudební video, které kompletně produkovala společnost Veo 3, kde byly vizuální stránka i hudba dokonale synchronizované.
The Economic Times poznamenal, že tento typ technologie by se dal nazvat „novou érou filmové tvorby“, která umožňuje komukoli – od jednotlivých tvůrců až po velká mediální studia – vytvářet profesionální obsah s nízkými náklady a s minimálními zdroji.
Zdroj: https://znews.vn/ac-mong-tu-ai-tao-video-moi-cua-google-post1556018.html








Komentář (0)