ByteDance開発チームによると、OmniHuman-1と呼ばれるオムニモーダルモデルは、キャラクターが話したり、歌ったり、動いたりするダイナミックなビデオを「現在のビデオ作成方法に比べて優れた品質」で作成できるという。

「ディープフェイク」とも呼ばれる、リアルな画像、動画、音声を作成する AI 技術は、詐欺やエンターテイメントでますます利用されるようになっています。

バイトダンスは現在、中国で最も注目されているAI企業の一つです。同社の豆豬(Doubao)アプリは、中国本土のユーザーの間で最も人気があります。

OmniHuman-1はまだ広く一般に公開されていませんが、サンプル動画は急速に広まりました。

目立ったデモの一つは、アルバート・アインシュタインの演説を描いた23秒の動画でした。TechCrunchは、このアプリの成果物を「驚くほど素晴らしい」「これまでで最もリアルなディープフェイク動画」と評しました。

開発者らによると、OmniHuman-1 では、任意の長さのビデオを作成するために、音声や歌声などのオーディオデータに加えて、参照データとして単一の画像のみが必要であるとのこと。

出力ビデオのフレーム レートを調整できるほか、ビデオ内のキャラクターの「体の比率」も調整できます。

d6a434e5a4dc974582b09c05b3646092afcf9490.jpeg
バイトダンスは現在、中国で最も著名なAI企業の一つです。写真:TechCrunch

さらに、未公開のソースからの 19,000 時間のビデオ コンテンツでトレーニングされた AI モデルは、既存のビデオを編集したり、人間の手や足の動きを説得力のある程度に変更したりすることもできます。

しかし、ByteDanceは、OmniHuman-1がまだ特定のポーズに苦労しており完璧ではないこと、また「低品質の参照画像」では最高のビデオは作成できないことも認めた。

バイトダンスの新しいAIモデルは、ワシントンが技術輸出を制限しようとしているにもかかわらず、中国が進歩していることを示している。

懸念事項

昨年、 政治的なディープフェイクが世界中に拡散しました。モルドバでは、マイア・サンドゥ大統領の辞任演説を模倣したディープフェイク動画が作られました。

また南アフリカでは、同国の選挙を前に、ラッパーのエミネムが南アフリカの野党を支持するディープフェイク動画が話題になっている。

ディープフェイクは金融犯罪にもますます利用されています。著名人が投資を推奨したり、偽の投資機会を提供したりしているディープフェイクに消費者が騙され、企業は経営幹部のなりすましによって数百万ドルもの損失を被っています。

デロイトによれば、AI生成コンテンツは2023年に120億ドル以上の詐欺被害をもたらし、米国では2027年までに400億ドルに達する可能性があるという。

昨年2月、AIコミュニティの数百人がディープフェイクの規制強化を求める書簡に署名しました。米国にはディープフェイクを犯罪とする連邦法はありませんが、10以上の州でAIを活用した偽造を禁止する法律が制定されています。

しかし、ディープフェイクを見抜くのは容易ではありません。一部のソーシャルメディアプラットフォームや検索エンジンは、ディープフェイクの拡散を抑制する対策を講じていますが、オンライン上のディープフェイクコンテンツの量は依然として驚くべき速度で増加しています。

本人確認会社Jumioが2024年5月に実施した調査では、回答者の60%が過去1年間にディープフェイクに遭遇したと報告し、回答者の72%が日常的にディープフェイクに騙されることを心配していると答え、過半数がAI生成の偽動画の蔓延に対処するための法案の可決を支持した。

Googleは、兵器や監視技術におけるAIの利用を「承認」した。Googleは、兵器や監視技術に利用するためのAIツールの設計・導入を行わないという約束を破った。