TikTokの親会社が、Googleに挑戦する技術を発表した。

ByteDanceの新しいツールは、競合他社を圧倒的に凌駕している。写真： ByteDance 。

TikTokとDouyinの親会社であるByteDanceは、テキストと画像から動画を作成できる人工知能（AI）ツール「Seedance 1.0」を正式に発表した。これは、AIを活用したコンテンツ制作プラットフォームの開発競争において、中国のテクノロジー大手である同社にとって重要な一歩と見られている。

同社は先日、Seedance 1.0に関する詳細な調査結果を発表した。この調査によると、Seedanceは、詳細なスクリプトや複雑なコマンドを必要とせず、簡単な指示を高品質なビデオに変換するように設計されている。個々のショットの処理だけでなく、複数のカメラアングルの合成、スムーズなトランジションの実現、ビデオ全体を通してキャラクターの一貫性の維持も可能だ。

「私たちは、動画内の空間情報と時間情報を分離する方法を発見しました。この技術は、位置情報を『エンコード』する特殊な手法を用いることで、AIがテキストと画像の両方から同じモデル内で動画を作成する方法を学習できるようにします。その結果、AIは複数の異なるショットをスムーズに組み合わせた動画を自動的に作成できるようになります」と、ByteDanceは研究論文の中で述べています。

ByteDanceは、Seedance 1.0が既存のAI動画制作ツールを凌駕していると自信を持って主張しており、特にユーザーのアイデアを忠実に再現する能力、画像の鮮明さ、自然なキャラクターの動きにおいて優れているとしている。

AIモデルの性能分析・評価を専門とするプラットフォーム「Artificial Analysis」によると、Seedance 1.0は、GoogleのVeo 3、KuaishouのKling 2.0、OpenAIのSoraといった他のAI動画作成ツールを凌駕した。このツールは、テキストから動画への変換と画像から動画への変換の両方において、優れた性能を発揮した。

同社はまた、Seedance 1.0は、一般公開されているライセンス取得済みのソースから収集された膨大な動画データベースで学習されたことを明らかにした。学習用動画は、暴力的な内容や不適切な内容を除去するために、厳格なフィルタリング処理を受けた。

多くの人は、このデータは主にByteDance自身が運営するTikTokとDouyinという2つのプラットフォームから得られたものだと考えている。

Seedance 1.0のトレーニングプロセスはいくつかの段階に分かれています。まず、豊富な画像データや動画データから学習し、次に、さまざまなスタイルのトランジション技術についてより深く学習していきます。

人間もトレーニングプロセスにおいて重要な役割を果たします。エンジニアは、モデルの学習に使用する高品質な動画を選定します。トレーニングループは、Seedance 1.0がオンデマンドで生成された多数の動画の中から最適な結果を自律的に選択できるようになるまで続きます。

現在、Seedance 1.0では動画の長さが最大5秒に制限されています（Veo 3は8秒）。しかし、最大の利点はその処理速度の速さです。フルHD動画の作成にかかる時間はわずか41秒です。Seedance 1.0の欠点の1つは、Googleのサービスのように自動音声オーバーレイに対応していないことです。

ByteDanceは、このツールを一般ユーザーとプロのコンテンツクリエイターの両方に向けて近日中にリリースする予定で、プロモーションビデオやソーシャルメディア向けのショートコンテンツの制作ニーズに応えるものとなる。

Seedance 1.0以前にも、ByteDanceはOmniHuman、Goku、Jimeng AIといったAI動画制作ツールを開発してきた。しかし、Seedance 1.0は、AIを活用した動画制作能力において競合他社を凌駕できると同社が自信を持って主張できる初の製品である。

出典：https://znews.vn/cong-ty-me-tiktok-ra-mat-cong-nghe-thach-thuc-google-post1562025.html