Model omnimodal, yang disebut OmniHuman-1, dapat membuat video dinamis karakter yang berbicara, bernyanyi, dan bergerak dengan "kualitas superior dibandingkan dengan metode pembuatan video saat ini," menurut tim pengembang ByteDance.

Teknologi AI yang menciptakan gambar, video, dan audio realistis, yang juga dikenal sebagai "deepfake," semakin banyak digunakan dalam penipuan dan hiburan.

ByteDance saat ini merupakan salah satu perusahaan AI terpopuler di Tiongkok. Aplikasi Doubao milik perusahaan ini adalah yang paling populer di kalangan pengguna daratan Tiongkok.

Meskipun OmniHuman-1 belum dirilis secara luas ke publik, video-video sampelnya telah menyebar dengan cepat.

Salah satu demo yang menonjol adalah video berdurasi 23 detik yang menggambarkan Albert Einstein sedang berpidato. TechCrunch menggambarkan hasil aplikasi tersebut sebagai "sangat menakjubkan" dan "video deepfake paling realistis hingga saat ini."

Para pengembang mengatakan bahwa OmniHuman-1 hanya membutuhkan satu gambar sebagai data referensi beserta data audio seperti ucapan atau nyanyian untuk membuat video dengan durasi berapa pun.

Kecepatan bingkai video keluaran dapat disesuaikan, begitu pula "proporsi tubuh" karakter di dalamnya.

d6a434e5a4dc974582b09c05b3646092afcf9490.jpeg
ByteDance saat ini merupakan salah satu perusahaan AI paling terkemuka di Tiongkok. Foto: TechCrunch

Selain itu, model AI yang dilatih menggunakan 19.000 jam konten video dari sumber yang belum dipublikasikan, mampu mengedit video yang sudah ada dan bahkan mengubah gerakan tangan dan kaki manusia dengan tingkat akurasi yang meyakinkan.

Namun, ByteDance juga mengakui bahwa OmniHuman-1 belum sempurna, karena masih kesulitan dengan pose-pose tertentu, dan bahwa "gambar referensi berkualitas rendah" tidak akan menghasilkan video terbaik.

Model AI baru ByteDance menunjukkan kemajuan China meskipun ada upaya Washington untuk membatasi ekspor teknologi.

Kekhawatiran

Tahun lalu, deepfake politik menyebar secara global. Di Moldova, video deepfake menirukan pidato pengunduran diri presiden negara itu, Maia Sandu.

Dan di Afrika Selatan, sebuah deepfake yang menampilkan rapper Eminem mendukung partai oposisi Afrika Selatan menjadi viral menjelang pemilihan umum negara tersebut.

Deepfake juga semakin banyak digunakan untuk melakukan kejahatan keuangan. Konsumen ditipu oleh deepfake selebriti yang merekomendasikan investasi dan menawarkan peluang investasi palsu, sementara perusahaan kehilangan jutaan dolar karena peniruan identitas eksekutif senior.

Menurut Deloitte, konten yang dihasilkan oleh AI menyebabkan kerugian akibat penipuan lebih dari $12 miliar pada tahun 2023 dan dapat mencapai $40 miliar di AS pada tahun 2027.

Pada bulan Februari lalu, ratusan orang di komunitas AI menandatangani surat yang menyerukan regulasi yang lebih ketat terhadap deepfake. Meskipun tidak ada undang-undang federal yang mengkriminalisasi deepfake di AS, lebih dari 10 negara bagian telah memberlakukan undang-undang terhadap pemalsuan yang didukung AI.

Namun, mendeteksi deepfake bukanlah hal yang mudah. ​​Meskipun beberapa platform media sosial dan mesin pencari telah menerapkan langkah-langkah untuk membatasi penyebarannya, jumlah konten deepfake daring masih terus meningkat dengan kecepatan yang mengkhawatirkan.

Dalam survei Mei 2024 oleh perusahaan verifikasi identitas Jumio, 60% peserta melaporkan pernah menemui deepfake dalam setahun terakhir; 72% responden mengatakan mereka khawatir tertipu oleh deepfake setiap hari, sementara mayoritas mendukung pengesahan undang-undang untuk mengatasi proliferasi video palsu yang dihasilkan AI.

Google 'memberi lampu hijau' penggunaan AI dalam teknologi senjata dan pengawasan . Google telah melanggar janjinya untuk tidak merancang dan menerapkan perangkat AI untuk digunakan dalam teknologi senjata dan pengawasan.