
Vid Google I/O 2025-evenemanget chockade Google teknikvärlden när de introducerade en videogenererande AI-modell som heter Veo 3, vilket markerade ett stort steg framåt för en teknikjätte inom ett kontroversiellt område.
Enligt The Verge- reportern Allison Johnsons erfarenhet är det mest sofistikerade med Veo 3 dess förmåga att skapa originellt ljud för varje video, från ljudeffekter och bakgrundsljud till och med karaktärsdialog.
”Veo 3 framstår för mig som en fullständigt 'skräp'-genererande AI-innehållsgenerator”, kommenterade The Verge- reportern.
Nya funktioner och chockerande realism
”Vi går in i en ny era av kreativitet”, förklarade Josh Woodward, vice vd för Googles Gemini, under lanseringen av Veo 3, och lyfte fram möjligheten att skapa ”ultrarealistiska” videor.
Johnson var inledningsvis skeptisk, men efter att ha upplevt AI-verktyget själv var hon övertygad om att Woodward inte överdrev. Veo 3 kan skapa produkter som är skrämmande realistiska.
Mer specifikt försökte The Verge- reportern skapa en kort video med innehållet av en nyhetsankare som tillkännager en brand. Klippet är extremt övertygande, med ljudkvalitet och scenografi som liknar vilken traditionell nyhetsrapport som helst.
![]() |
En scen från en video skapad av Veo 3. Foto: The Verge. |
Inlägget, som inkluderade en serie videor med AI-genererade karaktärer som protesterade mot kommandona som användes för att skapa de AI-genererade videorna, har sedan dess fått 50 000 uppröster på Reddit. Scenerna inkluderar en katastrof, en kvinna som ligger i en sjukhussäng i en respirator och en karaktär som hotas med en pistol – allt med talad dialog och realistiska bakgrundsljud.
Jämfört med andra AI-verktyg för videoskapande har Veo 3 gjort saker och ting mycket enklare. Allt som krävs är ett grundläggande kommando, några minuters väntan på att plattformen ska bearbetas och en prenumeration på Googles AI Ultra-abonnemang ( 249,99 USD per månad).
Det var ännu enklare för Johnson att skapa videor med mindre specifika kommandon, och det pekade på en sak: Veo 3 utmärker sig på att skapa YouTube-innehåll för barn med lägsta gemensamma nämnare.
Slutet på "stumfilmseran"
Hittills har ingen AI-videogenereringsmodell kunnat ge synkroniserat ljud, eller något ljud alls, som komplement till videoutgången. Veo 3 – med sina funktioner för synkroniserad ljudgenerering – strävar dock efter att avsluta den "tysta eran".
”Vi lämnar den tysta eran av videoskapande”, sa Google DeepMinds VD Demis Hassabis under en presskonferens.
Den utbredda tillgängligheten av verktyg för videobyggare har lett till en explosion av leverantörer till den grad att utrymmet börjar bli mättat.
Från startups som Runway, Lightricks, Genmo, Pika, Higgsfield, Kling och Luma, till teknikjättar som OpenAI och Alibaba, släpps modeller i snabb takt. I många fall är det liten skillnad mellan dessa modeller.
Det återstår att se om Veo 3 kommer att kunna överträffa OpenAI Sora vad gäller videokvalitet, men möjligheten att visa färdigproducerade videor med både ljud och video skulle omedelbart kunna göra Veo 3 till en mer övertygande plattform.
![]() |
Den mest framstående funktionen hos Veo 3 är dess förmåga att skapa ljud i "perfekt" synkronisering med video. Foto: Google. |
”I film- och tv- världen är bakgrundsljud och ljudeffekter ofta konstnärers verk. Tänk dig nu om allt du behövde göra var att beskriva för Veo det ljud du ville ha i bakgrunden och kopplat till handlingen, och det skulle mata ut allt, inklusive video och dialog. Det här är arbete som animatörer skulle lägga veckor eller månader på”, kommenterade Johnson.
Om Veo 3 faktiskt kan följa kommandon och mata ut timmar av konsekvent video och ljud, kommer det inte dröja länge innan vi har den första animerade långfilmen skapad helt med AI.
Strax efter att Veo 3 lanserades började skaparna dela klipp på plattformar som X, inklusive en ståuppkomikvideo skapad helt med AI. Tittarna blev förvånade över att få veta att hela scenen, inklusive röst, video och till och med publikens ljud, skapades utifrån bara en textbeskrivning.
Sedan finns det ytterligare ett viralt klipp som återskapar Pythagoras när han förklarar sin berömda sats, komplett med forntida kontext och korrekt dialog. Det finns till och med en musikvideo gjord helt av Veo 3, där bilder och musik är perfekt synkroniserade.
Economic Times kommenterade att den här typen av teknik skulle kunna kallas "en ny era inom filmskapande", vilket gör det möjligt för vem som helst – från enskilda kreatörer till stora mediestudior – att producera professionellt innehåll till låg kostnad och med minimala resurser.
Källa: https://znews.vn/ac-mong-tu-ai-tao-video-moi-cua-google-post1556018.html
Kommentar (0)