
Izraelští vědci vyvinuli nástroj pro vytváření videí s umělou inteligencí pomocí počítačové myši - Ilustrace: FREEPIK
Výzkumníci z Technologického institutu Technion (Izrael) vyvinuli novou technologii, která umožňuje uživatelům ovládat pohyb ve videích generovaných umělou inteligencí pomocí jednoduchých operací přetahování myší.
Technologie s názvem Time to Move (TTM) byla vyvinuta informatiky Henrym a Marilyn Taubovými z Technionu.
Podle výzkumného týmu je jedním z největších omezení současných systémů pro tvorbu videa s využitím umělé inteligence neschopnost přesně ovládat pohyb postav a objektů v čase. Uživatelé sice mohou vytvářet videa z textových popisů, ale detailní manipulace s pohybem objektů v rámci záběru zůstává náročná.
Dr. Or Litany, vedoucí výzkumného týmu, uvedl, že TTM byl navržen tak, aby tento problém vyřešil. Namísto nutnosti přeškolovat model umělé inteligence na obrovském množství video dat nebo používat specializované výpočetní systémy stačí uživatelům provést několik jednoduchých akcí myši k nasměrování požadovaného pohybu ve videu.
Klíčovou vlastností TTM je jeho schopnost integrace jako pluginu do stávajících modelů generování videa bez nutnosti přeškolení systému. To výrazně snižuje náklady na nasazení ve srovnání s předchozími metodami, které vyžadovaly individuální přizpůsobení modelu a spotřebovávaly značné výpočetní prostředky.
Jádrem TTM je metoda „dual-clock denoising“. Tato technika umožňuje systému optimalizovat pohyb podle záměrů uživatele a zároveň zachovat přirozenost videa a minimalizovat vynucený nebo nepřirozený pohyb.
Výsledky testů ukazují, že TTM dosahuje srovnatelných, nebo dokonce překonává některé tradiční metody založené na tréninku, pokud jde o přesnost pohybu a realismus. Kromě řízení pohybu systém umožňuje úpravu tvaru objektů a přidávání nových objektů do záběrů – funkce, které mnoho současných technologií nepodporuje.
Výzkumníci se domnívají, že TTM je významným krokem ke generaci intuitivnějších nástrojů pro tvorbu videa s využitím umělé inteligence, které uživatelům dávají snadnější kontrolu nad obsahem, než aby se spoléhali výhradně na textové příkazy.
Zdroj: https://tuoitre.vn/tao-video-ai-gio-chi-can-keo-tha-chuot-20260614104059316.htm











