Google is een van de technologiebedrijven die zeer actief is in de race om tools voor kunstmatige intelligentie (AI) te ontwikkelen, waaronder de Gemini chatbot om te concurreren met ChatGPT of de Imagen tekstgebaseerde tool voor het maken van afbeeldingen. Googles vermogen om video's te maken van beschrijvende tekst wordt door de technologiegemeenschap echter nog steeds als veel minderwaardig beschouwd dan dat van zijn concurrenten.
Onlangs heeft Google officieel de Gemini Advanced-tool voor gebruikersondersteuning geïntroduceerd, waarmee tekst kan worden omgezet in video's met een hoge resolutie van 8 seconden. Tegelijkertijd is de Whisk Animate-functie geïmplementeerd, waarmee statische afbeeldingen kunnen worden omgezet in levendige animatievideo's met een vergelijkbare duur. Beide functies zijn nu beschikbaar voor gebruikers met een Google One AI Premium-abonnement.
Volgens Google markeert Veo 2 een sprong voorwaarts in videoproductie, ontworpen om gedetailleerde, realistische en filmische video's met hoge resolutie te produceren. Door realistische natuurkundige wetten en menselijke bewegingen vast te leggen, kan Veo 2 vloeiende karakterbewegingen, dynamische scènes en prachtige details creëren in een breed scala aan onderwerpen en stijlen.
Om een video te maken, moeten gebruikers Veo 2 selecteren in het modellenmenu in Gemini (de locatie van deze optie in de interface kan tijdens de ontwikkeling veranderen). Deze functie maakt een video van 8 seconden met een resolutie van 720p, geëxporteerd als MP4-formaat met een liggende beeldverhouding van 16:9. Google merkt ook op dat gebruikers een limiet kunnen instellen voor het aantal video's dat ze per maand kunnen maken.
Gebruikers beschrijven simpelweg de scène die ze voor ogen hebben, of het nu een kort verhaal, een visueel idee of een specifieke scène is. Gemini brengt die ideeën vervolgens tot leven. Hoe gedetailleerder de beschrijving van de gebruiker, hoe beter de uiteindelijke video zal zijn.
Google zegt dat gebruikers video's die met de Veo 2 zijn gemaakt, gemakkelijk kunnen delen op socialemediaplatforms zoals TikTok of YouTube Shorts. Video's die met de Veo 2 zijn gemaakt, hebben echter een beeldverhouding van 16:9, wat absoluut niet geschikt is om te delen op deze videoplatforms.

De functie voor het maken van video's wordt nu wereldwijd uitgerold naar Gemini Advanced-gebruikers, zowel online als mobiel. De functie is echter alleen beschikbaar voor gebruikers met een Google One AI Premium-abonnement, met volledige taalondersteuning op Gemini.
Momenteel wordt Veo 2 door Google aangeboden aan Gemini Advanced-gebruikers, met een serviceprijs van 489.000 VND/maand in Vietnam.
Naast Veo 2 heeft Google ook een AI-tool gelanceerd met de naam Whisk Animate. Hiermee kunnen gebruikers nieuwe afbeeldingen met beschrijvende tekst maken en deze afbeelding vervolgens omzetten in een video met vloeiende bewegingen. Deze tool heeft echter net als Veo 2 een maximale lengte van slechts 8 seconden.
Whisk, een experiment van Google Labs dat eind 2024 van start gaat, helpt gebruikers snel nieuwe ideeën te verkennen en te visualiseren via tekst- en beeldprompts. Gebruikers kunnen hun ideeën tot leven brengen met de Whisk Animate-functie.
Whisk Animate biedt de mogelijkheid om foto's van gebruikers om te zetten in live video's van 8 seconden met behulp van Veo 2-technologie. De functie is beschikbaar voor Google One AI Premium-abonnees in meer dan 60 landen.

Google heeft ook aangegeven dat het belangrijke maatregelen heeft geïmplementeerd om een veilige video-ervaring te garanderen. Dit omvat red teaming en uitgebreide controle om te voorkomen dat er content wordt gemaakt die in strijd is met het beleid van Google. Bovendien is elke video die met Veo 2 is gemaakt, voorzien van SynthID, een digitaal watermerk dat in elk frame is ingebouwd en duidelijk aangeeft dat de video door AI is gegenereerd.
Bron: https://www.vietnamplus.vn/google-gioi-thieu-cong-cu-ai-chuyen-doi-van-ban-thanh-video-tu-gemini-advanced-post1033671.vnp
Reactie (0)