Vietnam.vn - Nền tảng quảng bá Việt Nam

«Πίσω από τις κάμερες» της τεχνητής νοημοσύνης που μετατρέπει κείμενο σε βίντεο σε λίγα λεπτά

Με λίγες μόνο εντολές, η Τεχνητή Νοημοσύνη μπορεί να δημιουργήσει ζωντανά καρέ, από το φόντο, τον φωτισμό μέχρι κάθε μικρή κίνηση... Πώς το κάνει αυτό;

Báo Tuổi TrẻBáo Tuổi Trẻ16/08/2025

AI - Ảnh 1.

Δημιουργία εικόνας χρησιμοποιώντας εργαλεία τεχνητής νοημοσύνης

Στο παρελθόν, για να φτιάξεις ένα βίντεο , χρειαζόσουν μια κάμερα, έναν σκηνοθέτη, ηθοποιούς και ώρες μοντάζ. Τώρα, με λίγες μόνο λέξεις στο πληκτρολόγιο, η Τεχνητή Νοημοσύνη μπορεί να δημιουργήσει ζωντανά, ολοκληρωμένα καρέ από το φόντο, τον φωτισμό μέχρι κάθε μικρή κίνηση.

Πίσω από αυτό το «θαύμα» κρύβεται μια σειρά από εξελιγμένες τεχνολογίες που λίγοι γνωρίζουν.

Από το κείμενο στην εικόνα: Το πρώτο ταξίδι

Σύμφωνα με την έρευνα του Tuoi Tre Online , όταν πληκτρολογείτε μερικές περιγραφικές προτάσεις, το σύστημα τεχνητής νοημοσύνης θα «διαβάσει» πρώτα το περιεχόμενο χρησιμοποιώντας τεχνολογία επεξεργασίας φυσικής γλώσσας (NLP). Όχι μόνο αναγνωρίζει κάθε λέξη, αλλά αναλύει επίσης τα συμφραζόμενα, τα συναισθήματα και τις σχέσεις μεταξύ των στοιχείων της πρότασης.

Για παράδειγμα, αν γράψετε «απογευματινή βροχή στην παλιά πόλη», η τεχνητή νοημοσύνη θα γνωρίζει ότι πρόκειται για μια εξωτερική σκηνή, με καιρικά στοιχεία, απογευματινό φως και κλασικό αρχιτεκτονικό σκηνικό.

Αφού κατανοήσει το περιεχόμενο, η Τεχνητή Νοημοσύνη (AI) προχωρά στο αρχικό στάδιο δημιουργίας ακίνητης εικόνας. Σε αυτό το βήμα, μια κοινή τεχνολογία είναι το μοντέλο διάχυσης, όπου η Τεχνητή Νοημοσύνη «ζωγραφίζει» την εικόνα από ένα θορυβώδες λευκό φόντο μέχρι να γίνει ορατή κάθε λεπτομέρεια. Κάθε pixel υπολογίζεται για να διασφαλιστεί ότι ο φωτισμός, το χρώμα, η σύνθεση και το στυλ είναι σωστά.

Λίγοι γνωρίζουν ότι σε αυτό το στάδιο, η Τεχνητή Νοημοσύνη μπορεί να δημιουργήσει δεκάδες δοκιμαστικές εκδόσεις και να επιλέξει την καλύτερη πριν συνεχίσει.

Ένα άλλο «μυστικό» είναι ότι τα προηγμένα συστήματα ενσωματώνουν επίσης τεράστιες βάσεις δεδομένων εικόνων, οι οποίες έχουν εκπαιδευτεί από πολλές πηγές. Αυτό δίνει στην Τεχνητή Νοημοσύνη τη μνήμη εκατομμυρίων λεπτομερειών, από τον τρόπο που το νερό αντανακλά το φως, μέχρι τον τρόπο που τα δέντρα γέρνουν στον άνεμο, έτσι ώστε το πρώτο καρέ να είναι όσο το δυνατόν πιο φυσικό.

Πώς η Τεχνητή Νοημοσύνη μετατρέπει τις εικόνες σε ομαλή κίνηση

Μόλις ολοκληρωθεί το πρώτο καρέ, η μεγαλύτερη πρόκληση είναι η μετατροπή του σε μια συνεχή ακολουθία εικόνων που δίνουν την εντύπωση κίνησης. Η Τεχνητή Νοημοσύνη χρησιμοποιεί μοντέλα πρόβλεψης κίνησης για να απεικονίσει πώς θα αλλάξει κάθε αντικείμενο με την πάροδο του χρόνου. Εδώ έρχονται στο προσκήνιο οι αλγόριθμοι φυσικής, οι οποίοι προσομοιώνουν παράγοντες όπως η βαρύτητα, ο άνεμος, το νερό ή το κούνημα της εικονικής κάμερας.

Για να αποτρέψει το τραύλισμα των σκηνών, η τεχνητή νοημοσύνη χρησιμοποιεί παρεμβολή καρέ . «Φαντάζεται» ενδιάμεσα καρέ μεταξύ δύο στιγμών και στη συνέχεια τα συνδυάζει σε ομαλή κίνηση. Εάν υπάρχουν χαρακτήρες στο βίντεο, το σύστημα πρέπει επίσης να επεξεργάζεται κινήσεις του σώματος, εκφράσεις του προσώπου και κινήσεις των ματιών για να ταιριάζει με τα συμφραζόμενα.

Ένα ελάχιστα γνωστό μυστικό: Πριν από την προβολή, πολλά συστήματα τεχνητής νοημοσύνης εκτελούν επίσης ένα αυτοματοποιημένο βήμα «μετά-παραγωγής». Προσαρμόζουν το χρώμα, τον φωτισμό, προσθέτουν θάμπωμα ή εφέ βάθους για να κάνουν το βίντεο να μοιάζει σαν να έχει γυριστεί από επαγγελματική κάμερα. Ορισμένες πλατφόρμες δημιουργούν ακόμη και κατάλληλο θόρυβο περιβάλλοντος και μουσική υπόκρουση, κάνοντας το τελικό προϊόν να μοιάζει με πραγματική σκηνή.

Χάρη στον συνδυασμό πολλών τεχνολογιών, από την επεξεργασία γλώσσας, την τρισδιάστατη απόδοση, την προσομοίωση φυσικής, έως την επεξεργασία μετά την παραγωγή, με λίγες μόνο γραμμές κειμένου, οι χρήστες μπορούν να έχουν στην κατοχή τους ένα ολοκληρωμένο βίντεο. Αυτή η απρόσκοπτη λειτουργία κάνει πολλούς ανθρώπους να πιστεύουν ότι η Τεχνητή Νοημοσύνη «κινηματογραφεί», αλλά στην πραγματικότητα όλα κατασκευάζονται από το μηδέν , καρέ-καρέ, με ταχύτητα που οι άνθρωποι δεν μπορούν να συναγωνιστούν.

Επιστροφή στο θέμα
Τουάν Βι

Πηγή: https://tuoitre.vn/hau-truong-ai-chuyen-van-ban-thanh-video-trong-vai-phut-20250815190549144.htm


Σχόλιο (0)

No data
No data

Στο ίδιο θέμα

Στην ίδια κατηγορία

Χαμένος στο δάσος με τα νεράιδα, καθ' οδόν για την κατάκτηση του Φου Σα Φιν
Σήμερα το πρωί, η παραλιακή πόλη Quy Nhon είναι «ονειρική» στην ομίχλη
Σαγηνευτική ομορφιά του Σα Πα στην εποχή του «κυνηγιού σύννεφων»
Κάθε ποτάμι - ένα ταξίδι

Από τον ίδιο συγγραφέα

Κληρονομία

Εικόνα

Επιχείρηση

Η «μεγάλη πλημμύρα» στον ποταμό Thu Bon ξεπέρασε την ιστορική πλημμύρα του 1964 κατά 0,14 μέτρα.

Τρέχοντα γεγονότα

Πολιτικό Σύστημα

Τοπικός

Προϊόν