
Ізраїльські вчені розробили інструмент для створення відео зі штучним інтелектом за допомогою комп'ютерної миші - Ілюстрація: FREEPIK
Дослідники з Техніонського технологічного інституту (Ізраїль) розробили нову технологію, яка дозволяє користувачам керувати рухом у відео, згенерованих штучним інтелектом, за допомогою простих операцій перетягування мишею.
Технологію під назвою Time to Move (TTM) розробили інженери-інформатики Генрі та Мерілін Тауб з Техніона.
За словами дослідницької групи, одним із найбільших обмежень сучасних систем створення відео на базі штучного інтелекту є неможливість точно контролювати рух персонажів та об'єктів з часом. Хоча користувачі можуть створювати відео з текстових описів, детальне маніпулювання рухом об'єктів у кадрі залишається складним завданням.
Доктор Ор Літані, керівник дослідницької групи, сказав, що TTM був розроблений для вирішення цієї проблеми. Замість того, щоб перенавчати модель штучного інтелекту на величезних обсягах відеоданих або використовувати спеціалізовані обчислювальні системи, користувачам потрібно лише виконати кілька простих дій мишею, щоб направити потрібний рух у відео.
Ключовою особливістю TTM є його здатність інтегруватися як плагін в існуючі моделі генерації відео без необхідності перенавчання системи. Це значно знижує витрати на розгортання порівняно з попередніми методами, які вимагали індивідуального налаштування моделі та споживали значні обчислювальні ресурси.
В основі TTM лежить метод «шумозаглушення з подвійною частотою». Цей метод дозволяє системі оптимізувати рух відповідно до намірів користувача, зберігаючи природність відео, мінімізуючи вимушений або неприродний рух.
Результати тестів показують, що TTM досягає порівнянних, або навіть перевершує деякі традиційні методи навчання з точки зору точності та реалізму руху. Окрім керування рухом, система дозволяє редагувати форму об'єктів та додавати нові об'єкти до відеоматеріалів – функції, які не підтримуються багатьма сучасними технологіями.
Дослідники вважають, що TTM – це значний крок до створення більш інтуїтивно зрозумілих інструментів для створення відео на основі штучного інтелекту, що надають користувачам легший контроль над контентом, замість того, щоб покладатися виключно на текстові команди.
Джерело: https://tuoitre.vn/tao-video-ai-gio-chi-can-keo-tha-chuot-20260614104059316.htm







