Google je jednou z technologických společností, která se velmi aktivně angažuje v závodě o vývoj nástrojů umělé inteligence (AI), včetně chatbota Gemini, který má konkurovat ChatGPT, nebo textového nástroje Imagen pro tvorbu obrázků. Schopnost Googlu vytvářet videa z popisného textu je však technologickou komunitou stále považována za mnohem horší než u konkurence.
Společnost Google nedávno oficiálně představila nástroj, který uživatelům Gemini Advanced pomůže převést text do videí ve vysokém rozlišení s délkou trvání 8 sekund. Zároveň byla nasazena i funkce Whisk Animate, která umožňuje přeměnit statické obrázky na živá animovaná videa s podobnou délkou trvání. Obě tyto funkce jsou nyní k dispozici uživatelům, kteří si předplatí Google One AI Premium.
Google uvádí, že Veo 2 představuje krok vpřed v oblasti tvorby videa. Je navržen tak, aby produkoval detailní, realistická a filmová videa s vysokým rozlišením. Veo 2 dokáže zachytit fyziku reálného světa a lidský pohyb a vytvářet plynulé pohyby postav, dynamické scény a vynikající detaily v široké škále témat a stylů.
Pro vytvoření videa budou muset uživatelé v aplikaci Gemini vybrat Veo 2 z nabídky modelů (umístění této možnosti v rozhraní se může během vývoje změnit). Funkce vytvoří 8sekundové video v rozlišení 720p, exportované jako MP4 s poměrem stran 16:9 na šířku. Google také upozorňuje, že uživatelé jsou omezeni počtem videí, která mohou za měsíc vytvořit.
Uživatelé jednoduše popíší scénu, kterou si představují, ať už je to krátký příběh, vizuální nápad nebo konkrétní scéna. Gemini pak tyto nápady vdechne životu. Čím podrobnější je popis uživatele, tím lepší bude výsledné video.
Google uvádí, že uživatelé mohou snadno sdílet videa vytvořená Veo 2 na platformách sociálních médií, jako je TikTok nebo YouTube Shorts. Videa vytvořená Veo 2 však mají poměr stran 16:9, což je pro sdílení na těchto video platformách zcela nevhodné.

Funkce tvorby videí je nyní dostupná pro uživatele Gemini Advanced po celém světě, a to jak na webu, tak na mobilních zařízeních. Je však k dispozici pouze těm, kteří si předplatili prémiový tarif Google One s AI, s plnou jazykovou podporou v Gemini.
V současné době je Veo 2 poskytován společností Google uživatelům Gemini Advanced s cenou služby 489 000 VND/měsíc ve Vietnamu.
Kromě Veo 2 Google také spustil nástroj umělé inteligence s názvem Whisk Animate, který umožňuje uživatelům vytvářet nové obrázky s popisným textem a poté tyto obrázky převést na video s plynulým pohybem, ale má také maximální délku pouze 8 sekund, podobně jako Veo 2.
Whisk, experiment Google Labs spuštěný koncem roku 2024, pomáhá uživatelům rychle prozkoumávat a vizualizovat nové nápady prostřednictvím textových i obrazových pokynů. Uživatelé mohou svým nápadům vdechnout život pomocí funkce Whisk Animate.
Whisk Animate přináší možnost převést statické fotografie uživatelů na živá 8sekundová videa pomocí technologie Veo 2. Tato funkce je dostupná pro předplatitele Google One AI Premium ve více než 60 zemích.

Společnost Google rovněž uvedla, že podnikla významné kroky k zajištění bezpečného procesu tvorby videí. Patří mezi ně tzv. „red teaming“ a rozsáhlá kontrola, která má zabránit vytváření obsahu porušujícího zásady společnosti Google. Každé video vytvořené pomocí Veo 2 je navíc označeno technologií SynthID, což je digitální vodoznak vložený do každého snímku, který jasně ukazuje, že video bylo generováno umělou inteligencí.
Zdroj: https://www.vietnamplus.vn/google-gioi-thieu-cong-cu-ai-chuyen-doi-van-ban-thanh-video-tu-gemini-advanced-post1033671.vnp
Komentář (0)