Syarikat induk TikTok melancarkan teknologi untuk mencabar Google.

Alat baharu ByteDance dengan yakin mengatasi semua pesaing. Foto: ByteDance .

ByteDance, syarikat induk TikTok dan Douyin, secara rasminya telah memperkenalkan Seedance 1.0, alat kecerdasan buatan (AI) yang mampu menghasilkan video daripada teks dan imej. Ini dilihat sebagai langkah penting bagi gergasi teknologi China itu dalam usaha membangunkan platform penciptaan kandungan berkuasa AI.

Syarikat itu baru-baru ini menerbitkan satu kajian terperinci mengenai Seedance 1.0. Menurut kajian itu, alat ini direka bentuk untuk menukar arahan ringkas kepada video berkualiti tinggi tanpa memerlukan skrip terperinci atau arahan yang kompleks. Ia bukan sahaja mengendalikan tangkapan individu tetapi juga menggabungkan pelbagai sudut kamera, memastikan peralihan yang lancar dan mengekalkan konsistensi watak sepanjang video.

“Kami telah menemui cara untuk memisahkan maklumat ruang dan masa dalam video. Teknologi ini menggunakan kaedah khas untuk ‘mengekod’ lokasi, membantu AI belajar mencipta video daripada teks dan imej dalam model yang sama. Hasilnya, AI boleh mencipta video secara automatik dengan pelbagai rakaman berbeza dengan lancar,” kata ByteDance dalam kertas penyelidikan tersebut.

ByteDance dengan yakin mendakwa bahawa Seedance 1.0 mengatasi alatan penciptaan video AI sedia ada di pasaran, terutamanya dari segi keupayaannya untuk mengikuti idea pengguna, ketajaman imej dan pergerakan watak semula jadi dengan teliti.

Menurut Artificial Analysis , sebuah platform yang mengkhusus dalam menganalisis dan menilai prestasi model AI, Seedance 1.0 telah mengatasi alat penciptaan video AI lain seperti Veo 3 Google, Kling 2.0 Kuaishou dan Sora OpenAI. Alat ini menunjukkan prestasi unggul dalam kedua-dua tugas penukaran teks-ke-video dan imej-ke-video.

Syarikat itu juga mendedahkan bahawa Seedance 1.0 telah dilatih menggunakan pangkalan data video yang besar, yang dikumpulkan daripada sumber yang tersedia secara umum dan berlesen. Video latihan tersebut telah menjalani proses penapisan yang ketat untuk mengalih keluar kandungan yang ganas atau sensitif.

Ramai yang percaya bahawa data tersebut terutamanya berasal dari TikTok dan Douyin, dua platform yang dikendalikan oleh ByteDance sendiri.

Proses latihan Seedance 1.0 dibahagikan kepada beberapa peringkat: pada mulanya belajar daripada data imej dan video yang kaya, kemudian terus belajar secara mendalam tentang teknik peralihan dalam pelbagai gaya.

Manusia juga memainkan peranan penting dalam proses latihan, kerana jurutera memilih video berkualiti tinggi untuk model tersebut pelajari. Gelung latihan berterusan sehingga Seedance 1.0 boleh memilih hasil optimum secara bebas daripada banyak video yang dijana atas permintaan.

Pada masa ini, Seedance 1.0 mengehadkan tempoh video kepada maksimum 5 saat (berbanding 8 saat untuk Veo 3). Walau bagaimanapun, kelebihannya yang menonjol ialah kelajuan pemprosesannya yang pantas: ia hanya mengambil masa 41 saat untuk menghasilkan video Full HD. Satu kelemahan Seedance 1.0 ialah ia masih belum menyokong tindanan bunyi automatik seperti rakan sejawatnya dari Google.

ByteDance merancang untuk melancarkan alat ini tidak lama lagi untuk pengguna umum dan pencipta kandungan profesional, bagi memenuhi keperluan menghasilkan video promosi atau kandungan pendek untuk media sosial.

Sebelum Seedance 1.0, ByteDance telah membangunkan alatan penciptaan video AI seperti OmniHuman, Goku dan Jimeng AI. Walau bagaimanapun, Seedance 1.0 ialah produk pertama yang didakwa oleh syarikat itu dengan yakin dapat mengatasi pesaingnya dalam keupayaan penciptaan video berkuasa AI.

Sumber: https://znews.vn/cong-ty-me-tiktok-ra-mat-cong-nghe-thach-thuc-google-post1562025.html