Vietnam.vn - Nền tảng quảng bá Việt Nam

A Google bemutatja a Gemini Advanced mesterséges intelligencia eszközét, amely szöveget videóvá alakít

A Google bemutatta a Gemini Advanced felhasználói támogató eszközt, amely szöveges bekezdéseket konvertál nagy felbontású, 8 másodperces videókká.

VietnamPlusVietnamPlus18/04/2025

A Google egyike azon technológiai vállalatoknak, amelyek nagyon aktívak a mesterséges intelligencia (MI) eszközök fejlesztéséért folytatott versenyben, beleértve a Gemini chatbotot, amely versenyre kel a ChatGPT-vel, vagy az Imagen szövegalapú képkészítő eszközt. A Google leíró szövegből történő videókészítési képességét azonban a technológiai közösség továbbra is messze alulmúlja a versenytársaiéhoz képest.

A Google a közelmúltban hivatalosan is bemutatta a Gemini Advanced felhasználói támogató eszközt, amellyel szöveget lehet nagy felbontású, 8 másodperces videókká konvertálni. Ezzel egy időben a Whisk Animate funkció is megjelent, amely képes a statikus képeket hasonló hosszúságú, élénk animált videókká alakítani. Mindkét funkció elérhető a Google One AI Premium előfizetői számára.

A Google szerint a Veo 2 előrelépést jelent a videókészítésben, mivel nagy felbontású, részletes, realisztikus és filmszerű videók készítésére tervezték. A valós fizikát és emberi mozgást rögzítve a Veo 2 gördülékeny karaktermozgásokat, dinamikus jeleneteket és kifinomult részleteket képes létrehozni a témák és stílusok széles skáláján.

Videó készítéséhez a felhasználóknak a Gemini modellek menüjéből kell kiválasztaniuk a Veo 2-t (ennek az opciónak a helye a felületen a fejlesztés során változhat). Ez a funkció egy 8 másodperces videót készít 720p felbontásban, MP4 formátumban exportálva 16:9-es fekvő képaránnyal. A Google azt is megjegyzi, hogy a felhasználók korlátozhatják a havonta létrehozható videók számát.

A felhasználók egyszerűen leírják az elképzelt jelenetet, legyen az egy novella, egy vizuális ötlet vagy egy konkrét jelenet. A Gemini ezután életre kelti ezeket az ötleteket. Minél részletesebb a felhasználó leírása, annál jobb lesz a végső videó.

A Google szerint a felhasználók könnyedén megoszthatják a Veo 2 által készített videókat olyan közösségi média platformokon, mint a TikTok vagy a YouTube Shorts. A Veo 2 által készített videók képaránya azonban 16:9, ami teljesen alkalmatlan ezeken a videóplatformokon való megosztásra.

hinh-anh-2.png
Az eredményül kapott parancs: Egy animált jelenet egy apró egérről, amely túlméretezett szemüveget visel, és egy könyvet olvas egy gomba csillogó fényében, egy hangulatos fészekben az erdő közepén.

A videókészítési funkció mostantól világszerte elérhető a Gemini Advanced felhasználók számára, weben és mobilon egyaránt. Azonban csak azok számára érhető el, akik előfizettek a Google One AI Premium csomagra, a Gemini teljes nyelvi támogatásával.

Jelenleg a Google biztosítja a Veo 2-t a Gemini Advanced felhasználók számára, a szolgáltatás ára Vietnámban havi 489 000 VND.

A Veo 2 mellett a Google elindított egy Whisk Animate nevű mesterséges intelligencia alapú eszközt is, amely lehetővé teszi a felhasználók számára, hogy új képeket készítsenek leíró szöveggel, majd ezt a képet folyamatos mozgású videóvá alakítsák, de a Veo 2-höz hasonlóan csak maximum 8 másodperces hosszúsággal rendelkezik.

A Whisk, egy Google Labs kísérlet, amely 2024 végén indul, segít a felhasználóknak gyorsan felfedezni és vizualizálni az új ötleteket szöveges és képes promptok segítségével. A felhasználók életre kelthetik ötleteiket a Whisk Animate funkcióval.

A Whisk Animate lehetővé teszi a felhasználók állóképeinek élő, 8 másodperces videókká alakítását a Veo 2 technológia segítségével. A funkció több mint 60 országban érhető el a Google One AI Premium előfizetői számára.

hinh-anh-3.png
A videó fotókból áll össze.

A Google azt is közölte, hogy jelentős intézkedéseket vezetett be a biztonságos videókészítési élmény biztosítása érdekében. Ez magában foglalja a „red teaming” jelzést és az átfogó ellenőrzést, hogy megakadályozza a Google irányelveit sértő tartalmak létrehozását. Ezenkívül minden, a Veo 2-vel készített videót SynthID címkével látnak el, amely egy digitális vízjel, amelyet minden képkockába beágyaznak, és amely egyértelműen jelzi, hogy mesterséges intelligencia generálta.

(Vietnám+)

Forrás: https://www.vietnamplus.vn/google-gioi-thieu-cong-cu-ai-chuyen-doi-van-ban-thanh-video-tu-gemini-advanced-post1033671.vnp


Hozzászólás (0)

No data
No data

Ugyanebben a kategóriában

A Hoang Su Phi békés aranyévszaka a Tay Con Linh magas hegyeiben
Da Nang faluja a világ 50 legszebb faluja között 2025-ben
A lámpáskészítő falu elárasztja a megrendeléseket az Őszközépi Fesztivál alatt, amint beérkezik a megrendelés, azonnal elkészítik a lámpásokat.
Veszélyesen ringatózik a sziklán, a sziklákba kapaszkodva, hogy hínárlekvárt kaparjon a Gia Lai strandon

Ugyanattól a szerzőtől

Örökség

Ábra

Üzleti

No videos available

Hír

Politikai rendszer

Helyi

Termék