A Google egyike azon technológiai vállalatoknak, amelyek nagyon aktívak a mesterséges intelligencia (MI) eszközök fejlesztéséért folytatott versenyben, beleértve a Gemini chatbotot, amely versenyre kel a ChatGPT-vel, vagy az Imagen szövegalapú képkészítő eszközt. A Google leíró szövegből történő videókészítési képességét azonban a technológiai közösség továbbra is messze alulmúlja a versenytársaiéhoz képest.
A Google a közelmúltban hivatalosan is bemutatta a Gemini Advanced felhasználói támogató eszközt, amellyel szöveget lehet nagy felbontású, 8 másodperces videókká konvertálni. Ezzel egy időben a Whisk Animate funkció is megjelent, amely képes a statikus képeket hasonló hosszúságú, élénk animált videókká alakítani. Mindkét funkció elérhető a Google One AI Premium előfizetői számára.
A Google szerint a Veo 2 előrelépést jelent a videókészítésben, mivel nagy felbontású, részletes, realisztikus és filmszerű videók készítésére tervezték. A valós fizikát és emberi mozgást rögzítve a Veo 2 gördülékeny karaktermozgásokat, dinamikus jeleneteket és kifinomult részleteket képes létrehozni a témák és stílusok széles skáláján.
Videó készítéséhez a felhasználóknak a Gemini modellek menüjéből kell kiválasztaniuk a Veo 2-t (ennek az opciónak a helye a felületen a fejlesztés során változhat). Ez a funkció egy 8 másodperces videót készít 720p felbontásban, MP4 formátumban exportálva 16:9-es fekvő képaránnyal. A Google azt is megjegyzi, hogy a felhasználók korlátozhatják a havonta létrehozható videók számát.
A felhasználók egyszerűen leírják az elképzelt jelenetet, legyen az egy novella, egy vizuális ötlet vagy egy konkrét jelenet. A Gemini ezután életre kelti ezeket az ötleteket. Minél részletesebb a felhasználó leírása, annál jobb lesz a végső videó.
A Google szerint a felhasználók könnyedén megoszthatják a Veo 2 által készített videókat olyan közösségi média platformokon, mint a TikTok vagy a YouTube Shorts. A Veo 2 által készített videók képaránya azonban 16:9, ami teljesen alkalmatlan ezeken a videóplatformokon való megosztásra.

A videókészítési funkció mostantól világszerte elérhető a Gemini Advanced felhasználók számára, weben és mobilon egyaránt. Azonban csak azok számára érhető el, akik előfizettek a Google One AI Premium csomagra, a Gemini teljes nyelvi támogatásával.
Jelenleg a Google biztosítja a Veo 2-t a Gemini Advanced felhasználók számára, a szolgáltatás ára Vietnámban havi 489 000 VND.
A Veo 2 mellett a Google elindított egy Whisk Animate nevű mesterséges intelligencia alapú eszközt is, amely lehetővé teszi a felhasználók számára, hogy új képeket készítsenek leíró szöveggel, majd ezt a képet folyamatos mozgású videóvá alakítsák, de a Veo 2-höz hasonlóan csak maximum 8 másodperces hosszúsággal rendelkezik.
A Whisk, egy Google Labs kísérlet, amely 2024 végén indul, segít a felhasználóknak gyorsan felfedezni és vizualizálni az új ötleteket szöveges és képes promptok segítségével. A felhasználók életre kelthetik ötleteiket a Whisk Animate funkcióval.
A Whisk Animate lehetővé teszi a felhasználók állóképeinek élő, 8 másodperces videókká alakítását a Veo 2 technológia segítségével. A funkció több mint 60 országban érhető el a Google One AI Premium előfizetői számára.

A Google azt is közölte, hogy jelentős intézkedéseket vezetett be a biztonságos videókészítési élmény biztosítása érdekében. Ez magában foglalja a „red teaming” jelzést és az átfogó ellenőrzést, hogy megakadályozza a Google irányelveit sértő tartalmak létrehozását. Ezenkívül minden, a Veo 2-vel készített videót SynthID címkével látnak el, amely egy digitális vízjel, amelyet minden képkockába beágyaznak, és amely egyértelműen jelzi, hogy mesterséges intelligencia generálta.
Forrás: https://www.vietnamplus.vn/google-gioi-thieu-cong-cu-ai-chuyen-doi-van-ban-thanh-video-tu-gemini-advanced-post1033671.vnp
Hozzászólás (0)