ChatGPT を所有する OpenAI 社は、その人工知能技術をビデオ分野に導入しています。同社は次世代 AI モデル「Sora」を発表したばかりだ。 Sora は、OpenAI の既存の画像生成 AI ツールである DALL-E と同様に動作します。
ユーザーが希望する説明プロンプトを入力すると、Sora ソフトウェアは、複数のキャラクター、特定の種類のモーション、および入力プロンプトに強く関連する詳細を含むシーンを提供する機能を備えた高解像度のビデオ クリップを返します。
「このAIモデルは、ユーザーがプロンプトで何を求めているかを理解するだけでなく、それらが物理世界にどのように存在するかも理解します」と同社のブログ投稿には記されている。
「Sora」と呼ばれる新しいモデルでは、ユーザーが希望する説明プロンプトを高解像度のビデオクリップに変換できます。 (画像:OpenAIサンプルビデオより抜粋)
OpenAIはSoraによって、MetaやGoogleなどの企業のビデオ生成AIツールと競争することを目指している。同様の AI ツールは、Stable Video Diffusion という製品を持つ Stability AI など、他のスタートアップからも提供されています。 Amazon はまた、プロンプトに基づいて子供向けの短編アニメーションコンテンツを作成することに特化したモデルである Create with Alexa もリリースしました。
現在、Sora ソフトウェアは 1 分以下のビデオの作成に制限されています。これまでのところ、Sora はモデルの脆弱性をテストする小規模なチームにのみ提供されています。同社は、ウェブサイトで公開されている 10 個のサンプル紹介クリップ以外、公開デモをまだリリースしていない。
市場調査会社ABIリサーチのシニアアナリスト、リース・ヘイデン氏によると、この種のAIモデルはデジタルエンターテイメント市場に大きな影響を与える可能性があるという。現時点ではこのモデルにはまだ多くの制限がありますが、将来の市場の方向性を示しています。
チャットボットや画像ジェネレーターが消費者やビジネスの世界に進出するにつれ、ビデオは生成AIの次のフロンティアになる可能性があると専門家は言う。革新的な機会は AI 愛好家を興奮させる一方で、世界中で主要な 政治選挙が近づくにつれ、こうした新しいテクノロジーは誤情報に関する深刻な懸念も引き起こすだろう。機械学習企業Clarityのデータによると、2023年にはAI生成のディープフェイク動画や写真の数が前年比900%増加した。
[広告2]
ソース
コメント (0)