TechSpotによると、米国の著者グループがMetaを提訴し、同社が生成AIモデルの学習に違法に書籍を使用していると訴えた。Metaは著作権侵害を否定しているものの、先日公開された社内メールには、同社の上級スタッフやエンジニアの一部が、AI学習プロセスに海賊版書籍をダウンロードすることについて協議していたことが記録されている。
Meta AIは、AIを訓練するために海賊版書籍をダウンロードして配布していたという内部証拠をめぐって法廷闘争に巻き込まれている。
訴訟資料によると、Metaは数百万冊の海賊版書籍をアーカイブ化した「LibGen」を含む、物議を醸すデータセットを使用していた。Metaは以前、このデータセットの使用は「フェアユース」に該当すると主張していた。しかし、新たに公開された電子メールでは、Metaがデータセットをダウンロードしただけでなく、BitTorrentネットワーク経由で配布していたことが明らかになり、深刻な法的問題が生じている。
メールによると、Metaは複数の海賊版書籍リポジトリから少なくとも81.7テラバイトのデータをダウンロードし、共有していた。これにはZ-LibraryとLibGenからの35.7テラバイトも含まれていた。原告らはこれを「信じられないほどのトレントキャンペーン」と呼び、Metaはこれらのデータファイルをダウンロードしただけでなく、積極的に大規模に配布していたと主張した。
Metaの研究員ニコライ・バシュリコフ氏が2023年4月に送った社内メールでは、「会社のコンピューター上のトレントが動作していないようだ」と記されていた。この発言は笑いの絵文字で締めくくられていたものの、その数ヶ月後には彼の口調は劇的に変化した。2023年9月、バシュリコフ氏は、トレントの使用(つまり海賊版データの「シード」)が明らかに違法であるため、Metaの法務部に連絡したと述べた。
文書には、MetaのCEOであるマーク・ザッカーバーグ氏が同社によるLibGenの使用を認識していたことも示されています。Metaは検出を回避するため、Facebookのメインシステムの外部にサーバーを設置し、トレントやデータ配信活動を隠蔽していたと報じられています。従業員のフランク・チャン氏からの別の社内メールでは、この戦術を「ステルスモード」と呼んでいます。
Metaは現在、AIの開発と生成AI関連サービスに多額の投資を行っています。同社はまた、チャットボットやAIキャラクターをソーシャルメディアエコシステムに統合することを検討しています。しかし、新たに明らかになった証拠により、Metaは著作権者からの訴訟において「フェアユース」の主張を擁護することが困難になる可能性があります。
[広告2]
出典: https://thanhnien.vn/meta-bi-cao-buoc-dung-noi-dung-sach-vi-pham-ban-quyen-de-huan-luyen-ai-185250209012630928.htm
コメント (0)