
Izraelscy naukowcy opracowali narzędzie do tworzenia filmów AI za pomocą myszy komputerowej – Ilustracja: FREEPIK
Naukowcy z Instytutu Technologii Technion (Izrael) opracowali nową technologię, która pozwala użytkownikom kontrolować ruch w filmach generowanych przez sztuczną inteligencję za pomocą prostych operacji przeciągania i upuszczania myszy.
Technologia ta, zwana Time to Move (TTM), została opracowana przez inżynierów informatyków Henry'ego i Marilyn Taub z Technion.
Według zespołu badawczego, jednym z największych ograniczeń obecnych systemów tworzenia filmów opartych na sztucznej inteligencji jest brak możliwości precyzyjnego sterowania ruchem postaci i obiektów w czasie. Chociaż użytkownicy mogą tworzyć filmy na podstawie opisów tekstowych, szczegółowe manipulowanie ruchem obiektów w kadrze pozostaje wyzwaniem.
Dr Or Litany, kierownik zespołu badawczego, powiedział, że TTM został zaprojektowany, aby rozwiązać ten problem. Zamiast konieczności ponownego trenowania modelu sztucznej inteligencji na ogromnych ilościach danych wideo lub korzystania ze specjalistycznych systemów obliczeniowych, użytkownicy muszą wykonać tylko kilka prostych ruchów myszą, aby sterować pożądanym ruchem w materiale wideo.
Kluczową cechą TTM jest możliwość integracji jako wtyczki z istniejącymi modelami generowania wideo bez konieczności ponownego szkolenia systemu. To znacznie obniża koszty wdrożenia w porównaniu z poprzednimi metodami, które wymagały indywidualnego dostosowywania modelu i pochłaniały znaczne zasoby obliczeniowe.
Podstawą TTM jest metoda „dual-clock denoising”. Technika ta pozwala systemowi optymalizować ruch zgodnie z intencjami użytkownika, zachowując jednocześnie naturalność obrazu wideo i minimalizując wymuszony lub nienaturalny ruch.
Wyniki testów pokazują, że TTM osiąga porównywalną, a nawet przewyższającą niektóre tradycyjne metody szkoleniowe pod względem dokładności ruchu i realizmu. Oprócz sterowania ruchem, system umożliwia edycję kształtu obiektów i dodawanie nowych obiektów do materiału filmowego – funkcje nieobsługiwane przez wiele obecnych technologii.
Naukowcy uważają, że TTM to ważny krok w kierunku powstania bardziej intuicyjnych narzędzi do tworzenia filmów opartych na sztucznej inteligencji. Dzięki nim użytkownicy będą mogli łatwiej kontrolować treści zamiast polegać wyłącznie na poleceniach tekstowych.
Źródło: https://tuoitre.vn/tao-video-ai-gio-chi-can-keo-tha-chuot-20260614104059316.htm










