Vietnam.vn - Nền tảng quảng bá Việt Nam

Velký problém s Veo 3

Tento model umělé inteligence automaticky vkládá do videí chaotické a bezvýznamné titulky více než měsíc po svém spuštění. Tato situace ukazuje, že Google je ochoten vydat nedokončené produkty, aby demonstroval své schopnosti v oblasti umělé inteligence.

ZNewsZNews19/07/2025

Veo3 je nejnovější model umělé inteligence od Googlu, který byl spuštěn koncem května a umožňuje uživatelům vytvářet videa na základě hlasových příkazů. Tento model přitáhl pozornost komunity tvůrců obsahu, protože umožňuje vytvářet videa se zvukem a dialogy, což je funkce, která v předchozích verzích modelu Googlu nebyla k dispozici, a tím je činí realističtějšími.

Mnoho uživatelů využívá videoklipy Veo 3, dlouhé až 8 sekund, k tvorbě reklam, ASMR videí, trailerů k fantasy filmům a vtipných pouličních rozhovorů.

Režisér nominovaný na Oscara Darren Aronofsky použil tento nástroj k vytvoření krátkého filmu s názvem Ancestra. Na tiskové konferenci generální ředitel společnosti Google DeepMind Demis Hassabis přirovnal Veo 3 k kroku „z éry němého filmu“ v kinematografii.

Titulky k filmu „Persistent“ z Veo 3

Mnoho uživatelů však zjistilo, že tento nástroj nefunguje podle očekávání. Při vytváření klipů s dialogy Veo 3 často automaticky vkládá nesmyslné, přeházené titulky, a to i v případě, že příkaz jasně uvádí, že titulky se nemají přidávat.

Odstranění těchto titulků není jednoduché. Uživatelé jsou nuceni klip znovu vytvořit a utratit „žetony“, což znamená utratit více peněz na Googlu, nebo použít externí nástroje k odstranění titulků, případně video oříznout, aby titulky odstranili.

video AI anh 1

Veo 3 produkuje realistické vizuální efekty a dialogy, které odpovídají pohybům rtů, ale titulky jsou bezvýznamné. Foto: Lesswrong .

Josh Woodward, viceprezident společností Google Labs a Gemini, 9. června na serveru X zveřejnil, že Google vyvinul záplaty, které mají problém se spamem omezit. Více než měsíc poté však uživatelé tento problém nadále hlásí na kanálu Discord služby Google Labs, což ukazuje, že oprava chyb ve velkých modelech umělé inteligence není snadná.

Stejně jako předchozí modely Googlu pro tvorbu videí s umělou inteligencí je i Veo 3 placený model s cenou od 249,99 dolarů měsíčně. Pro vytvoření 8sekundového videa zadají uživatelé popis do Flow, Gemini nebo jiné platformy. Každé vytvoření klipu pomocí Veo 3 stojí nejméně 20 kreditů s umělou inteligencí a uživatelé si mohou kredity dobít za 25 dolarů, což představuje 2 500 kreditů.

Mona Weiss, reklamní ředitelka, říká, že opětovné vytváření záběrů za účelem odstranění titulků se stává značným výdajem. „Pokud vytvoříte scénu s dialogy pomocí Veo3, asi 40 % výstupu bude mít bezvýznamné titulky, takže video bude nepoužitelné,“ říká. „Získání scény, která se vám líbí, stojí spoustu peněz, ale nakonec je nepoužitelná.“

Mohlo by vás zajímat
Paměťové čipy jsou ve vlně umělé inteligence vzácné.
Paměťové čipy jsou ve vlně umělé inteligence vzácné.VTV.vn - Šílenství v oblasti umělé inteligence snižuje nabídku pamětí, přičemž dodavatelé upřednostňují velké zákazníky a zvyšují náklady pro malé firmy.
Austrálie zavádí nový „štít“ proti phishingovým zprávám.
Austrálie zavádí nový „štít“ proti phishingovým zprávám.Od začátku roku 2026 předalo australské Národní centrum pro prevenci podvodů telekomunikačním společnostem ke zpracování seznamy více než 4 200 podezřelých telefonních čísel a 825 identifikátorů odesílatelů.
Lionel Messi a Cristiano Ronaldo byli nejvyhledávanějšími hráči během skupinové fáze mistrovství světa.
Lionel Messi a Cristiano Ronaldo byli nejvyhledávanějšími hráči během skupinové fáze mistrovství světa.Nejnovější data ukazují nárůst vyhledávání klíčových slov souvisejících s mistrovstvím světa ve fotbale 2026 o 1 550 %, přičemž Lionel Messi a Cristiano Ronaldo byli dvěma nejvyhledávanějšími hráči během skupinové fáze.
video AI anh 2

Nesmyslné titulky se na Veo 3 obtížně odstraňují. Foto: Technology Review .

Když Weiss nahlásila problém Google Labs přes Discord v naději, že získá zpět své promarněné kredity, tým podpory ji odkázal na oficiální oddělení podpory společnosti. Nabídli jí vrácení peněz za předplatné Veo 3, ale ne za kredity. Weiss odmítla, protože přijetí vrácení peněz by znamenalo ztrátu přístupu k modelu.

Tým podpory Google Labs Discord uvedl, že titulky se mohou automaticky aktivovat, pokud je detekován hlas, a na opravě této chyby pracují.

Problém pramení z přístupu Googlu.

Důvod, proč Veo 3 automaticky vkládá titulky, pramení z dat, na kterých byl model trénován.

Ačkoli Google nezveřejnil podrobnosti o kategoriích dat použitých k trénování svých modelů, pravděpodobně zahrnuje videa z platforem, jako jsou YouTube a TikTok, z nichž mnohé obsahují titulky. Tyto titulky jsou vloženy přímo do videozáznamů, takže je obtížné je odstranit před použitím jako trénovací data, uvádí Shuo Niu, výzkumník v oblasti platforem pro sdílení videa a umělé inteligence na Clark University (Massachusetts, USA).

„Modely převodu textu na video jsou trénovány pomocí posilovacího učení k vytváření obsahu, který napodobuje videa vytvořená člověkem, a pokud tato videa mají titulky, model se může „naučit“, že přidání titulků činí produkt více podobným videu vytvořenému člověkem,“ vysvětlil.

video AI anh 3

Veo 3 byl ovlivněn daty z trénování modelů z videí na YouTube a TikToku. Obrázek: Mashable .

Mluvčí Googlu uvedl: „Neustále vylepšujeme naše možnosti tvorby videí, zejména pokud jde o text, přirozeně znějící hlas a dokonale synchronizovaný zvuk. Uživatele vyzýváme, aby příkaz zopakovali, pokud shledají výsledky nekonzistentními, a poskytli nám zpětnou vazbu prostřednictvím funkce „To se mi líbí“ nebo „Nelíbí se mi“.

Vietnam povzbuzuje americké firmy k rozšíření investic do vyspělých technologií.
Vietnam povzbuzuje americké firmy k rozšíření investic do vyspělých technologií.Ráno 26. června v sídle vlády přijal místopředseda vlády Ho Quoc Dung pana Jeffa Place, ředitele dodavatelského řetězce společnosti Coherent Group (USA). Během setkání místopředseda vlády potvrdil, že Vietnam povzbuzuje americké podniky k rozšíření investic, zejména v oblasti high-tech, inovací a polovodičového průmyslu.
Povzbuzovat americké firmy k rozšíření investic do high-tech odvětví.
Povzbuzovat americké firmy k rozšíření investic do high-tech odvětví.Místopředseda vlády Ho Quoc Dung uvedl, že Vietnam vítá, aby americké firmy pokračovaly v rozšiřování svých aktivit ve Vietnamu, zejména v technologicky vyspělých odvětvích a sektorech s vysokou přidanou hodnotou.
Vietnam a Spojené státy posilují spolupráci při řešení následků války.
Vietnam a Spojené státy posilují spolupráci při řešení následků války.VTV.vn - Generální tajemník a prezident To Lam přijal 22. června úřadujícího tajemníka amerického námořnictva Hung Caa.

Důvod, proč tento model ignoruje výzvy jako „Žádné titulky“, je ten, že negativní výroky (které AI instruují, aby něco nedělala) jsou obecně méně účinné než afirmativní výzvy, tvrdí Tuhin Chakrabarty, výzkumník v oblasti systémů umělé inteligence na Stony Brook University.

Aby Google problém zcela vyřešil, bude muset prozkoumat každý snímek všech videí použitých k trénování Veo 3 a poté videa odstranit nebo přeznačit titulky, než model znovu natrénuje. To bude trvat týdny, dodal Chakrabarty.

Kateřina Cizek, dokumentaristka a umělecká ředitelka v MIT Open Documentary Lab, tvrdí, že tento problém ukazuje ochotu Googlu vydávat produkty, které ještě nejsou zcela dokončeny.

„Google potřebuje vítězství,“ prohlásil Cizek. „Musí být první, kdo vydá nástroj, který dokáže vytvářet zvuk odpovídající pohybům rtů. A to je důležitější než oprava problému s titulky.“

Zdroj: https://znews.vn/van-de-lon-cua-veo-3-post1569402.html

Trendy podle kategorie

Nejčtenější

Google Trends

Od stejného autora

Dědictví

Postava

Firmy

Aktuální události

Politický systém

Místní

Produkt

Happy Vietnam
Místo, kde „štěstí“ nepotřebuje tlumočníka

Místo, kde „štěstí“ nepotřebuje tlumočníka

Vzduch

Vzduch

Miliardářská vesnice etnické skupiny Xoi Dang v obci Tra Linh.

Miliardářská vesnice etnické skupiny Xoi Dang v obci Tra Linh.