Proof Newsの調査により、これらの企業は、非営利団体EleutherAIが作成したデータセット(48,000以上のチャンネルのYouTube 動画コンテンツの録画を含む)を、所有者やコンテンツ作成者から許可を得ずに使用していたことが明らかになった。

このデータセットには画像や動画は含まれていませんが、コンテンツはMarques BrownleeやMrBeastといったプラットフォーム上の主要なコンテンツクリエイターや、The New York Times、BBC、ABC Newsといった大手ニュース出版社から提供されています。さらに、Engadgetの動画の字幕も含まれています。

8d541010 38d9 11ef b7fd 2183e5dd7ce6.jpg
Apple Intelligenceは、YouTubeクリエイターコミュニティのデータを不正に使用したとして告発されている。写真:Yahoo! Tech。

「AppleはAI用のデータを多数の企業から入手している」と人気YouTuberのブラウンリー氏はXに投稿した。「その1つが、私のものも含め、YouTube動画からの大量のデータや記録だ」

以前、YouTubeのCEOであるニール・モハン氏は、YouTubeのデータを使ってAIモデルをトレーニングする企業は同プラットフォームの利用規約に違反していると主張していた。

現在、AI企業はアルゴリズムの学習に用いるデータについて、依然として透明性を欠いています。今月初め、アーティストや写真家たちは、今年中に数百万台のAppleデバイスで利用可能になる新しいAI機能「Apple Intelligence」の学習に用いるデータソースをAppleが開示していないとして批判しました。

世界最大の動画ホスティングプラットフォームである YouTube には、録画、音声、動画、画像などが含まれているため、AI のトレーニングにとってデータの「金鉱」でもあります。

今年初め、OpenAIの最高技術責任者であるミラ・ムラティ氏は、同社が今後リリース予定のAIビデオ作成ツールSoraのトレーニングにYouTubeビデオを使用したかどうかについてのウォール・ストリート・ジャーナルの質問を避けた。

「使用されたデータの詳細については触れませんが、ライセンス供与されたデータ、あるいは公開されているデータでした」とムラティ氏は当時述べた。一方、アルファベットのCEO、サンダー・ピチャイ氏も、YouTubeのデータをAIモデルの学習に利用する企業は、YouTubeの利用規約に違反していると強調した。

(Proof News、WSJによると)

AppleとSamsungが中国のスマートフォンブランドを上回る。Counterpoint Researchのデータによると、世界のスマートフォン市場は2024年第2四半期に6%成長し、AppleとSamsungがトップ2の座を占め、Xiaomi、Vivo、Oppoなどの中国ブランドがそれに続いた。