TikTokの親会社であるByteDanceは、画像と音声をリアルな動画に変換できる人工知能(AI)モデルを導入したばかりだ。
バイトダンスの開発チームによると、OmniHuman-1と呼ばれるこのマルチモーダルモデルは、キャラクターが話したり、歌ったり、動いたりする没入型のビデオを「現在のビデオ生成方法よりも優れた」品質で作成できるという。
実在の人物に似た画像、動画、音声を作成するAI技術は「ディープフェイク」とも呼ばれ、娯楽だけでなく詐欺にもますます利用されるようになっている。
ByteDanceは中国で最も注目されているAI企業の一つです。同社のDoubaoアプリは中国本土のユーザーの間で最も人気があります。
OmniHuman-1はまだ一般公開されていないものの、サンプル動画は瞬く間に話題になっています。
目玉の一つは、アルバート・アインシュタインのスピーチを収録した23秒の動画です。TechCrunchはこのアプリの成果を「驚くほど素晴らしい」「これまでで最もリアルなディープフェイク動画」と評しています。
開発者によれば、OmniHuman-1 は、任意の長さのビデオを作成するために、音声やボーカルなどのオーディオデータに加えて参照データとして単一の画像のみを必要とするという。
出力ビデオのフレーム レートを調整できるほか、ビデオ内のキャラクターの「体の比率」も調整できます。
それだけでなく、非公開ソースからの19,000時間のビデオコンテンツでトレーニングされたAIモデルは、既存のビデオを編集することもでき、人間の手や足のジェスチャーを説得力のあるレベルで変更することもできます。
しかし、バイトダンスは、OmniHuman-1は完璧ではなく、特定のポーズにはまだ困難があり、「低品質の参照画像」では最高のビデオは作成できないことも認めた。
バイトダンスの新しいAIモデルは、ワシントンの技術輸出制限の取り組みにもかかわらず、中国の進歩を示している。
懸念事項
昨年、 政治を題材にしたディープフェイク動画が話題になりました。モルドバでは、マイア・サンドゥ大統領の辞任演説を模倣したディープフェイク動画が拡散されました。
また南アフリカでは、同国の選挙を前に、ラッパーのエミネムが南アフリカの野党を支持するディープフェイク動画が話題になった。
ディープフェイクは金融犯罪にもますます利用されています。著名人が投資を勧めたり、偽の投資機会を提示したりするディープフェイクに消費者が騙される一方で、企業は幹部になりすましたなりすましによって数百万ドルもの損失を被っています。
デロイトによれば、AI生成コンテンツは2023年に120億ドル以上の詐欺被害をもたらし、米国では2027年までに400億ドルに達する可能性があるという。
昨年2月、AIコミュニティの数百人がディープフェイクの厳格な規制を求める書簡に署名しました。米国ではディープフェイクを連邦法で犯罪と規定していないものの、12州以上でAI偽造を禁じる法律が制定されています。
しかし、ディープフェイクを見抜くのは容易ではありません。一部のソーシャルネットワークや検索エンジンは拡散を抑制する対策を講じていますが、オンライン上のディープフェイクコンテンツの量は依然として驚くべき速度で増加しています。
本人確認会社Jumioが2024年5月に実施した調査では、回答者の60%が過去1年間にディープフェイクに遭遇したと回答し、回答者の72%が日常的にディープフェイクに騙されることを心配していると答えた。また、回答者の過半数がAI生成の偽動画の蔓延に対処するための法律の制定を支持した。
[広告2]
出典: https://vietnamnet.vn/model-ai-moi-cua-bytedance-noi-ran-ran-nho-kha-nang-deepfake-2368831.html
コメント (0)