
Israelische Wissenschaftler entwickeln ein Werkzeug zur Erstellung von KI-Videos mithilfe einer Computermaus – Illustration: FREEPIK
Forscher am Technion Institute of Technology (Israel) haben eine neue Technologie entwickelt, die es Benutzern ermöglicht, Bewegungen in KI-generierten Videos durch einfache Drag-and-Drop-Mausoperationen zu steuern.
Die Technologie mit dem Namen Time to Move (TTM) wurde von den Informatikingenieuren Henry und Marilyn Taub am Technion entwickelt.
Laut dem Forschungsteam besteht eine der größten Einschränkungen aktueller KI-gestützter Videoproduktionssysteme in der mangelnden Fähigkeit, die Bewegung von Figuren und Objekten im Zeitverlauf präzise zu steuern. Zwar können Nutzer Videos anhand von Textbeschreibungen erstellen, doch die detaillierte Steuerung der Objektbewegungen innerhalb des Bildausschnitts bleibt eine Herausforderung.
Dr. Or Litany, der Leiter des Forschungsteams, erklärte, dass TTM genau für dieses Problem entwickelt wurde. Anstatt das KI-Modell mit riesigen Mengen an Videodaten neu trainieren oder spezialisierte Computersysteme verwenden zu müssen, genügen den Nutzern wenige einfache Mausaktionen, um die gewünschte Bewegung im Video zu steuern.
Ein wesentliches Merkmal von TTM ist die Möglichkeit der Integration als Plug-in in bestehende Videogenerierungsmodelle, ohne dass ein System-Retraining erforderlich ist. Dies reduziert die Implementierungskosten im Vergleich zu früheren Methoden, die eine individuelle Modellanpassung erforderten und erhebliche Rechenressourcen beanspruchten, deutlich.
Kernstück von TTM ist die „Dual-Clock-Entrauschungsmethode“. Diese Technik ermöglicht es dem System, Bewegungen entsprechend den Absichten des Nutzers zu optimieren und gleichzeitig die Natürlichkeit des Videos zu erhalten, indem erzwungene oder unnatürliche Bewegungen minimiert werden.
Testergebnisse zeigen, dass TTM hinsichtlich Bewegungsgenauigkeit und Realismus vergleichbare oder sogar bessere Ergebnisse erzielt als einige traditionelle, trainingsbasierte Methoden. Neben der Bewegungssteuerung ermöglicht das System die Bearbeitung von Objektformen und das Hinzufügen neuer Objekte zum Videomaterial – Funktionen, die von vielen aktuellen Technologien nicht unterstützt werden.
Forscher glauben, dass TTM ein bedeutender Schritt hin zu einer Generation intuitiverer KI-Videoerstellungswerkzeuge ist, die den Nutzern eine einfachere Kontrolle über die Inhalte ermöglichen, anstatt sich ausschließlich auf Textbefehle zu verlassen.
Quelle: https://tuoitre.vn/tao-video-ai-gio-chi-can-keo-tha-chuot-20260614104059316.htm










