Το νέο εργαλείο της ByteDance ξεπερνά με σιγουριά όλους τους ανταγωνιστές. Φωτογραφία: ByteDance . |
Η ByteDance, η μητρική εταιρεία των TikTok και Douyin, παρουσίασε επίσημα το Seedance 1.0, ένα εργαλείο τεχνητής νοημοσύνης (AI) ικανό να δημιουργεί βίντεο από κείμενο και εικόνες. Αυτό θεωρείται ένα σημαντικό βήμα για τον κινεζικό τεχνολογικό γίγαντα στον αγώνα για την ανάπτυξη πλατφορμών δημιουργίας περιεχομένου με τεχνητή νοημοσύνη.
Η εταιρεία δημοσίευσε πρόσφατα μια λεπτομερή μελέτη για το Seedance 1.0. Σύμφωνα με τη μελέτη, αυτό το εργαλείο έχει σχεδιαστεί για να μετατρέπει απλές οδηγίες σε βίντεο υψηλής ποιότητας χωρίς να απαιτεί λεπτομερή σενάρια ή πολύπλοκες εντολές. Χειρίζεται όχι μόνο μεμονωμένα πλάνα, αλλά συνδυάζει επίσης πολλαπλές γωνίες κάμερας, εξασφαλίζει ομαλές μεταβάσεις και διατηρεί τη συνέπεια των χαρακτήρων σε όλο το βίντεο.
«Βρήκαμε έναν τρόπο να διαχωρίσουμε τις χωρικές και χρονικές πληροφορίες στο βίντεο. Αυτή η τεχνολογία χρησιμοποιεί μια ειδική μέθοδο για την «κωδικοποίηση» της τοποθεσίας, βοηθώντας την Τεχνητή Νοημοσύνη να μάθει να δημιουργεί βίντεο τόσο από κείμενο όσο και από εικόνες εντός του ίδιου μοντέλου. Ως αποτέλεσμα, η Τεχνητή Νοημοσύνη μπορεί να δημιουργεί αυτόματα βίντεο με πολλαπλές διαφορετικές λήψεις ομαλά», αναφέρει η ByteDance στην ερευνητική εργασία.
Η ByteDance ισχυρίζεται με σιγουριά ότι το Seedance 1.0 ξεπερνά τα υπάρχοντα εργαλεία δημιουργίας βίντεο με τεχνητή νοημοσύνη στην αγορά, ιδιαίτερα στην ικανότητά του να παρακολουθεί στενά τις ιδέες των χρηστών, την ευκρίνεια της εικόνας και τη φυσική κίνηση των χαρακτήρων.
Σύμφωνα με την Artificial Analysis , μια πλατφόρμα που ειδικεύεται στην ανάλυση και αξιολόγηση της απόδοσης μοντέλων τεχνητής νοημοσύνης, το Seedance 1.0 έχει ξεπεράσει άλλα εργαλεία δημιουργίας βίντεο με τεχνητή νοημοσύνη, όπως το Veo 3 της Google, το Kling 2.0 της Kuaishou και το Sora της OpenAI. Αυτό το εργαλείο επέδειξε ανώτερη απόδοση τόσο σε εργασίες μετατροπής κειμένου σε βίντεο όσο και σε εργασίες μετατροπής εικόνας σε βίντεο.
Η εταιρεία αποκάλυψε επίσης ότι το Seedance 1.0 εκπαιδεύτηκε σε μια τεράστια βάση δεδομένων βίντεο, τα οποία συλλέχθηκαν από δημόσια διαθέσιμες και αδειοδοτημένες πηγές. Τα εκπαιδευτικά βίντεο υποβλήθηκαν σε αυστηρή διαδικασία φιλτραρίσματος για την αφαίρεση βίαιου ή ευαίσθητου περιεχομένου.
Πολλοί πιστεύουν ότι τα δεδομένα προέρχονται κυρίως από το TikTok και το Douyin, δύο πλατφόρμες που διαχειρίζεται η ίδια η ByteDance.
Η διαδικασία εκπαίδευσης του Seedance 1.0 χωρίζεται σε διάφορα στάδια: αρχικά μαθαίνοντας από πλούσια δεδομένα εικόνας και βίντεο και στη συνέχεια συνεχίζοντας την εις βάθος εκμάθηση των τεχνικών μετάβασης σε διάφορα στυλ.
Οι άνθρωποι διαδραματίζουν επίσης κρίσιμο ρόλο στη διαδικασία εκπαίδευσης, καθώς οι μηχανικοί επιλέγουν βίντεο υψηλής ποιότητας για να μάθει το μοντέλο. Ο βρόχος εκπαίδευσης συνεχίζεται μέχρι το Seedance 1.0 να μπορεί να επιλέξει ανεξάρτητα το βέλτιστο αποτέλεσμα από πολλά βίντεο που δημιουργούνται κατ' απαίτηση.
Προς το παρόν, το Seedance 1.0 περιορίζει τη διάρκεια του βίντεο σε μέγιστο 5 δευτερόλεπτα (σε σύγκριση με 8 δευτερόλεπτα για το Veo 3). Ωστόσο, το ξεχωριστό του πλεονέκτημα είναι η γρήγορη ταχύτητα επεξεργασίας: χρειάζονται μόνο 41 δευτερόλεπτα για να δημιουργηθεί ένα βίντεο Full HD. Ένα μειονέκτημα του Seedance 1.0 είναι ότι δεν υποστηρίζει ακόμη την αυτόματη επικάλυψη ήχου όπως το αντίστοιχο της Google.
Η ByteDance σχεδιάζει να κυκλοφορήσει σύντομα αυτό το εργαλείο τόσο για γενικούς χρήστες όσο και για επαγγελματίες δημιουργούς περιεχομένου, εξυπηρετώντας τις ανάγκες παραγωγής διαφημιστικών βίντεο ή σύντομου περιεχομένου για τα μέσα κοινωνικής δικτύωσης.
Πριν από το Seedance 1.0, η ByteDance είχε αναπτύξει εργαλεία δημιουργίας βίντεο με τεχνητή νοημοσύνη, όπως τα OmniHuman, Goku και Jimeng AI. Ωστόσο, το Seedance 1.0 είναι το πρώτο προϊόν που η εταιρεία ισχυρίζεται με βεβαιότητα ότι μπορεί να ξεπεράσει τους ανταγωνιστές της σε δυνατότητες δημιουργίας βίντεο με τεχνητή νοημοσύνη.
Πηγή: https://znews.vn/cong-ty-me-tiktok-ra-mat-cong-nghe-thach-thuc-google-post1562025.html






Σχόλιο (0)