
Ισραηλινοί επιστήμονες αναπτύσσουν ένα εργαλείο για τη δημιουργία βίντεο με τεχνητή νοημοσύνη χρησιμοποιώντας ποντίκι υπολογιστή - Εικονογράφηση: FREEPIK
Ερευνητές στο Τεχνολογικό Ινστιτούτο Technion (Ισραήλ) ανέπτυξαν μια νέα τεχνολογία που επιτρέπει στους χρήστες να ελέγχουν την κίνηση σε βίντεο που δημιουργούνται από τεχνητή νοημοσύνη με απλές λειτουργίες drag-and-drop του ποντικιού.
Η τεχνολογία, που ονομάζεται Time to Move (TTM), αναπτύχθηκε από τους μηχανικούς πληροφορικής Henry και Marilyn Taub στην Technion.
Σύμφωνα με την ερευνητική ομάδα, ένας από τους μεγαλύτερους περιορισμούς των σημερινών συστημάτων δημιουργίας βίντεο που βασίζονται στην τεχνητή νοημοσύνη είναι η αδυναμία ακριβούς ελέγχου της κίνησης των χαρακτήρων και των αντικειμένων με την πάροδο του χρόνου. Ενώ οι χρήστες μπορούν να δημιουργήσουν βίντεο από περιγραφές κειμένου, ο λεπτομερής χειρισμός του τρόπου με τον οποίο κινούνται τα αντικείμενα μέσα στο καρέ παραμένει δύσκολος.
Ο Δρ. Ορ Λίτανι, επικεφαλής της ερευνητικής ομάδας, δήλωσε ότι το TTM σχεδιάστηκε για να λύσει αυτό το πρόβλημα. Αντί να χρειάζεται να επανεκπαιδεύσουν το μοντέλο τεχνητής νοημοσύνης σε τεράστιες ποσότητες δεδομένων βίντεο ή να χρησιμοποιήσουν εξειδικευμένα υπολογιστικά συστήματα, οι χρήστες χρειάζεται μόνο να εκτελέσουν μερικές απλές κινήσεις του ποντικιού για να κατευθύνουν την επιθυμητή κίνηση στο βίντεο.
Ένα βασικό χαρακτηριστικό του TTM είναι η ικανότητά του να ενσωματώνεται ως πρόσθετο (plug-in) σε υπάρχοντα μοντέλα δημιουργίας βίντεο χωρίς να απαιτείται επανεκπαίδευση του συστήματος. Αυτό μειώνει σημαντικά το κόστος ανάπτυξης σε σύγκριση με προηγούμενες μεθόδους, οι οποίες απαιτούσαν προσαρμογή του κάθε μοντέλου και κατανάλωναν σημαντικούς υπολογιστικούς πόρους.
Στον πυρήνα του TTM βρίσκεται η μέθοδος «διπλής αποθορυβοποίησης». Αυτή η τεχνική επιτρέπει στο σύστημα να βελτιστοποιεί την κίνηση σύμφωνα με τις προθέσεις του χρήστη, διατηρώντας παράλληλα τη φυσικότητα του βίντεο, ελαχιστοποιώντας την αναγκαστική ή αφύσικη κίνηση.
Τα αποτελέσματα των δοκιμών δείχνουν ότι το TTM επιτυγχάνει συγκρίσιμες, ή ακόμη και ξεπερνά, ορισμένες παραδοσιακές μεθόδους που βασίζονται στην εκπαίδευση όσον αφορά την ακρίβεια και τον ρεαλισμό της κίνησης. Εκτός από τον έλεγχο κίνησης, το σύστημα επιτρέπει την επεξεργασία σχήματος αντικειμένων και την προσθήκη νέων αντικειμένων στο υλικό λήψης - λειτουργίες που δεν υποστηρίζονται από πολλές τρέχουσες τεχνολογίες.
Οι ερευνητές πιστεύουν ότι το TTM αποτελεί ένα σημαντικό βήμα προς μια γενιά πιο διαισθητικών εργαλείων δημιουργίας βίντεο με τεχνητή νοημοσύνη, δίνοντας στους χρήστες ευκολότερο έλεγχο του περιεχομένου αντί να βασίζονται αποκλειστικά σε εντολές κειμένου.
Πηγή: https://tuoitre.vn/tao-video-ai-gio-chi-can-keo-tha-chuot-20260614104059316.htm







