
Israelske forskere udvikler et værktøj til at lave AI-videoer ved hjælp af en computermus - Illustration: FREEPIK
Forskere ved Technion Institute of Technology (Israel) har udviklet en ny teknologi, der giver brugerne mulighed for at styre bevægelse i AI-genererede videoer med simple træk-og-slip-museoperationer.
Teknologien, kaldet Time to Move (TTM), blev udviklet af datalogingeniørerne Henry og Marilyn Taub på Technion.
Ifølge forskerholdet er en af de største begrænsninger ved nuværende AI-drevne videooprettelsessystemer manglende evne til præcist at kontrollere bevægelsen af karakterer og objekter over tid. Selvom brugerne kan oprette videoer ud fra tekstbeskrivelser, er detaljeret manipulation af, hvordan objekter bevæger sig inden for rammen, fortsat udfordrende.
Dr. Or Litany, lederen af forskerholdet, sagde, at TTM var designet til at løse dette problem. I stedet for at skulle omskole AI-modellen på massive mængder videodata eller bruge specialiserede computersystemer, behøver brugerne kun at udføre et par enkle musehandlinger for at dirigere den ønskede bevægelse i videoen.
En central funktion ved TTM er dets evne til at integrere som et plugin i eksisterende videogenereringsmodeller uden at kræve systemgenoptræning. Dette reducerer implementeringsomkostningerne betydeligt sammenlignet med tidligere metoder, som krævede individuel modeltilpasning og forbrugte betydelige computerressourcer.
Kernen i TTM er "dual-clock denoising"-metoden. Denne teknik gør det muligt for systemet at optimere bevægelse i henhold til brugerens intentioner, samtidig med at videoens naturlighed bevares og tvungen eller unaturlig bevægelse minimeres.
Testresultater viser, at TTM opnår sammenlignelige, eller endda overgår, nogle traditionelle træningsbaserede metoder med hensyn til bevægelsesnøjagtighed og realisme. Ud over bevægelseskontrol muliggør systemet redigering af objektformer og tilføjelse af nye objekter til optagelser – funktioner, der ikke understøttes af mange nuværende teknologier.
Forskere mener, at TTM er et vigtigt skridt i retning af en generation af mere intuitive AI-videooprettelsesværktøjer, der giver brugerne nemmere kontrol over indhold i stedet for udelukkende at stole på tekstkommandoer.
Kilde: https://tuoitre.vn/tao-video-ai-gio-chi-can-keo-tha-chuot-20260614104059316.htm











