Το YouTube επικεντρώνεται στην ανάπτυξη τεχνητής νοημοσύνης για τη βελτίωση της εμπειρίας χρήστη. Φωτογραφία: Digiwatch . |
Ως η μεγαλύτερη διαδικτυακή πλατφόρμα βίντεο στον κόσμο, ένας από τους μεγαλύτερους περιορισμούς για τους θεατές του YouTube είναι το γλωσσικό εμπόδιο. Εν μέσω της ραγδαίας ανάπτυξης περιεχομένου που δημιουργείται από τεχνητή νοημοσύνη, το YouTube μόλις εισήγαγε μια λειτουργία αυτόματης αφήγησης, η οποία πλέον υποστηρίζει και τα βιετναμέζικα.
Στο εντυπωσιακό βίντεο του MKBHD σχετικά με το Samsung Galaxy S25 Edge, όταν γίνεται εναλλαγή στα βιετναμέζικα, η βιετναμέζικη φωνή ακούγεται σχετικά εύκολα κατανοητή και καθαρή. Αυτή η εμπειρία είναι αρκετά παρόμοια με την επαγγελματική φωνητική ανάγνωση με τεχνητή νοημοσύνη που χρησιμοποιείται συνήθως σε λογισμικό μετατροπής κειμένου σε ομιλία, όπως το Google Text-to-Speech και το FPT Play Voice.
Κατά την εναλλαγή μεταξύ της αρχικής αγγλικής έκδοσης, η μεταγλωττισμένη έκδοση είναι αρκετά ακριβής, διατηρώντας αρκετά καλά τις αποχρώσεις και τις εκφράσεις του δημιουργού. Η φωνή έχει τονικότητα, μερικές φορές χρησιμοποιώντας επιφωνήματα όπως «ναι, αυτό είναι όλο», δημιουργώντας την αίσθηση ότι σχεδόν υπάρχει μια άμεση συνομιλία.
Ωστόσο, οι μεταφράσεις που δημιουργούνται από την Τεχνητή Νοημοσύνη είναι συχνά μηχανικές, λέξη προς λέξη, με αποτέλεσμα αφύσικες και ανακριβείς προτάσεις. Οι θεατές πρέπει να ακούν προσεκτικά για να ερμηνεύσουν το νόημα που επιθυμεί ο δημιουργός.
Παρόλο που η αφήγηση βασίζεται εξ ολοκλήρου σε βιετναμέζικους υπότιτλους, η τεχνητή νοημοσύνη εξακολουθεί να προφέρει λανθασμένα λέξεις όπως «super», «customer» και «trade-off», προκαλώντας σύγχυση στους ακροατές. Αυτό μπορεί να οδηγήσει σε μονοτονία, ανακριβή επικοινωνία ή ελλιπές περιεχόμενο από την αρχική πηγή.
Πριν από την ανάρτηση ενός βίντεο, οι δημιουργοί θα μπορούν να ακούσουν προεπισκοπήσεις των ηχητικών ντοκουμέντων που παρέχονται από την Τεχνητή Νοημοσύνη. Τα βίντεο με υποστήριξη βιετναμέζικου ηχητικού ντοκουμέντου συνήθως έχουν έναν βιετναμέζικο τίτλο, μαζί με τη φράση "φωνή" ακριβώς από κάτω.
Η τεχνητή νοημοσύνη είναι παρούσα σε κάθε στάδιο, από τη δημιουργία ιδεών και την ανάλυση απόδοσης βίντεο έως τη δημιουργία υποτίτλων και τη μίμηση φωνής. Το YouTube αναμένει ότι μέσα στα επόμενα πέντε χρόνια, όλα τα βίντεο που θα ανεβαίνουν θα μπορούν να μεταγλωττίζονται αυτόματα σε πολλές γλώσσες, διατηρώντας παράλληλα την αρχική φωνή και τις εκφράσεις του δημιουργού.
Μέχρι τα τέλη Δεκεμβρίου 2024, αυτή η λειτουργία υποστήριζε εννέα γλώσσες κατά τη μετάφραση από τα αγγλικά. Στις αρχές του 2025, ο Neal Mohan, Διευθύνων Σύμβουλος του YouTube, επιβεβαίωσε επίσημα ότι η αυτόματη μεταγλώττιση με τεχνητή νοημοσύνη θα διατεθεί σε όλους τους συνεργάτες. Μέχρι τον Απρίλιο, η λειτουργία ενεργοποιήθηκε αθόρυβα για όλα τα κανάλια με δυνατότητα δημιουργίας εσόδων.
Μια ανάρτηση στο Reddit που εξέφραζε δυσαρέσκεια για αυτήν τη λειτουργία έλαβε πάνω από 100 σχόλια και 450 likes. Ένα άτομο υποστήριξε ότι πολλά προγράμματα λογισμικού φωνητικής μετάφρασης κάνουν ήδη αρκετά καλή δουλειά και το ίδιο το YouTube διαθέτει υπότιτλους, καλύπτοντας τις ανάγκες μετάφρασης γλώσσας των χρηστών.
Ένα άλλο σχόλιο ανέφερε ότι η Τεχνητή Νοημοσύνη παρερμήνευσε τον όρο «χωροχρόνος» ως «ελεύθερος χρόνος», οδηγώντας σε λανθασμένες μεταφράσεις. Πολλοί άλλοι χρήστες ανέφεραν επίσης ότι η λειτουργία ήταν αναποτελεσματική και αναζήτησαν τρόπους για να την απενεργοποιήσουν μέσα στην εφαρμογή.
Το ίδιο το YouTube αναγνωρίζει ότι η αυτόματη μεταγλώττιση με τεχνητή νοημοσύνη είναι ακόμα σχετικά νέα και καλωσορίζει τα σχόλια των χρηστών. Πριν από την ανάρτηση ενός βίντεο, η πλατφόρμα θα ειδοποιεί τους δημιουργούς για τους περιορισμούς της τεχνητής νοημοσύνης στην κατανόηση της σημασίας, της προφοράς και της διάκρισης θορύβου. Θα πρέπει να επαληθεύσουν την ακρίβεια της μεταγλώττισης πριν την κυκλοφορήσουν στους θεατές.
Ωστόσο, σύμφωνα με το Air.io , η λειτουργία αξίζει να δοκιμαστεί. Είναι ένας οικονομικός τρόπος για να ελέγξετε αν το κοινό απολαμβάνει το περιεχόμενο ενός δημιουργού και αν το κανάλι μπορεί να προσελκύσει νέους θεατές με αυτές τις μεταγλωττισμένες εκδόσεις. Αν και δεν είναι τέλεια, η τεχνολογία έχει τη δυνατότητα να επεκτείνει την εμβέλεια του περιεχομένου.
Προς το παρόν, δεν έχουν όλα τα βίντεο μεταγλωττισμένες εκδόσεις και οι χρήστες δεν μπορούν να απενεργοποιήσουν αυτήν τη λειτουργία από προεπιλογή. Αντ' αυτού, δοκιμάστε να αλλάξετε τη γλώσσα του προγράμματος περιήγησής σας στα Αγγλικά για να μειώσετε τη συχνότητα των μεταγλωττισμένων εκδόσεων με τεχνητή νοημοσύνη.
Πηγή: https://znews.vn/youtube-vua-dung-ai-de-pha-vo-rao-can-ngon-ngu-post1553547.html






Σχόλιο (0)