AIが制御不能になるリスク

[広告_1]

AIの発展は良い面と悪い面の両方をもたらします。そしてSORAの登場により、AI技術はこれまで以上に注目を集めるでしょう。

Sora - OpenAIの「新しい空」

Sora は、信じられないほどの品質でテキストから画像への変換を可能にするため、OpenAI にとって大きな前進です。

日本語で「SORA」は空を意味します。この技術を開発したチームは、無限の創造的可能性を想起させるため、「SORA」という名前を選びました。

Soraは、複数のキャラクターを動かし、詳細な背景を持つアニメーションを作成できます。このツールは、コマンド内の提案を理解するだけでなく、それが現実世界でどのように表現されるかまで理解します。レビューによると、Soraは映画制作者の作業をスピードアップさせるだけでなく、経験の浅いグラフィックエンジニアの作業を完全に置き換えることができるとされています。

テキストを画像に変換することに成功したAIプログラムはSoraだけではありません。過去1年間で、同様の機能を備えたプログラムが数多く登場しました。AI技術によって生み出される製品は、ますます完璧でリアルなものになっています。

ソラを支える最先端技術

リアルな動画を制作するには、Sora がユーザーの言語、リクエスト、コマンドを理解できなければなりません。しかし、それだけではありません。Sora は物理法則、物体の動き、キャラクターの動きによる光と影の変化も理解する必要があります。

例えば、東京の夜の街を歩く女の子を制作するという課題がありました。ソラが作成した作品は非常に良くできていました。鋭い観察力がなければ、動画の小さな欠陥を見つけることは難しいでしょう。

映像は99%リアルで、地面に溜まった雨水に反射する街灯の鮮やかさも再現されています。これらはコマンドには含まれていないものの、AIが現実世界の物理法則を理解し、自ら描画しています。

AIニュースによると、Soraを支える技術の一部は、テキストと画像の入力を処理できる大規模マルチモーダルモデルであるGPT-4です。GPT-4は、大量のオンラインデータで学習し、ユーザーのクエリに対して複雑な応答を生成するOpenAIの大規模言語モデルをアップデートしたものです。

Soraの残りの部分は拡散モデルで、静的ノイズを複数のステップで徐々に低減することで、まとまりのある動画に変換します。SoraはDalle-3と同じ技術も使用しており、テキストを画像に変換することで、非常にリアルな動画を生成します。

AIはクリエイティブ業界にどのような影響を与えるでしょうか?

写真、映画撮影、グラフィックデザインの分野で働く人々は、AIの発展に非常に関心を持っています。世界の映画の中心地であるハリウッドでは、専門家がすでにAIの影響を測定しています。

報告書によれば、ハリウッドの映画、テレビ、アニメーション業界の労働者の21.4%が2026年までにAIに置き換えられると予想されている。

昨年の夏、Netflix は AI プロダクトマネージャーのポジションの募集を開始しました。その給与は 30 万ドルから 90 万ドルという驚異的な額で、これは平均的な無名俳優の給与の何十倍にも相当します。

AIの無制限な発展に対する懸念

AIのトレンドは大きな波のようなものです。サーフィンを習得し、その波に乗れるようになれば、あなた自身、そしてあなたの仕事と地位は安全になり、さらには繁栄する可能性も高まります。

しかし、機会にはリスクが伴います。これらの超知能人工知能プログラムは、同時にリスクももたらします。そして、AIの想像を絶する発展により、これらのリスクはさらに懸念されるものとなっています。

ドイツのハイデルベルク大学情報工学部のデータ分析者トラン・ヴァン・カン博士によると、現在のSoraモデルには左右を混同したり、動画の再生中に連続した画像を維持できなかったりするなど、まだ多くの欠点があるものの、Soraが偽の情報を作成するリスクは十分にあり得、インターネット上で何が真実であるかを判断することがさらに困難になるという。

「Soraアプリケーションでは、Soraが作成する動画が非常にリアルであるため、本物のニュースと偽のニュースを見分けるのが非常に困難です。OpenAI自身も限られた解決策を見つけていますが、根本的な解決策はないことを認めなければなりません。近い将来、このアプリケーションではユーザーが画像とテキストを提供して新しい動画を作成できるようになるため、世界の有力者の発言が非常に簡単に偽造され、人々に大きな影響を与える可能性があります」とトラン・ヴァン・カン博士はコメントしました。

OpenAIはSora以前にも、人間のようなテキストを生成できるChatGPTと、「ディープフェイク」を作成するDALL-Eテクノロジーという2つの製品をリリースしています。ディープフェイクとは、AIを用いて偽の音声、画像、動画を作成する技術です。ローマ教皇、ドナルド・トランプ前米大統領、そして最近ではポップスターのテイラー・スウィフトが偽のポルノ画像を作成するために顔面移植を受けた事件など、多くの人がディープフェイクの被害者となっています。

「実際、OpenAIはGenAI技術のパイオニアです。非常に優秀な科学者チームを擁しています。AIモデルや人材、機械学習への投資予算は非常に大きく、OpenAIが生み出す製品は非常に高い信頼性を誇ります」とトラン・ヴァン・カン博士は述べています。

これは、AIの発展がインターネットの絶え間ない流れにプラス面とマイナス面の両方をもたらしていることを示しています。そして、Soraの登場により、技術競争はかつてないほど激化すると予想されます。現在、Meta、Google、Runway AIなどの大手テクノロジー企業も、テキストから動画を作成するAI技術の研究開発に取り組んでおり、同様のモデルを多数発表しています。

VTVによると

[広告2]
ソース