AI時代には、純粋に人間によるコンテンツが不足している。写真: Advertising Week |
2022年のChatGPTの出現は、インターネット上で人工知能コンテンツが爆発的に増加すると予想されます。ガートナーの予測によると、 2026年までに、テキスト、画像、動画など、インターネット上のコンテンツの90%がAIによって生成されるとされています。
AIは人間の思考を理解するように訓練されています。しかし、純粋に人間が生成したデータがなければ、AIはコピー機が自己複製するように、自らの古い情報を利用することになります。
多くの研究者は、人間が生成したオリジナルコンテンツを、現代の「クリーン」な鋼鉄、つまり希少で入手困難な同等品に例えています。彼らは、2022年までに誰もデータのコピーを保存しなければ、インターネットは純粋さを完全に失ってしまうのではないかと懸念しています。
歴史上の災害を再現
核兵器時代後の今、科学者たちは1945年以降に生産されたすべての鉄鋼が汚染されていることを発見しました。原子爆弾は大気を放射線で汚染し、その環境で生産された金属にもその影響が及んだのです。
このため、多くの鋼材はガイガーカウンターなどの高精度測定機器やその他の高感度センサーには使用できなくなっています。解決策は、放射性降下物の影響を受けない海底深くに沈んだ軍艦から古い鋼材を回収することです。
AI開発者にとって、ほとんどのモデルはインターネット上で収集された膨大な量の人間データで学習されています。しかし、今日のソフトウェアが過去に生成したテキストから学習すると、モデルが崩壊し、独創性と深みが薄れてしまうリスクがあります。
![]() |
第一次世界大戦で沈没した戦艦ヒンデンブルク号が引き上げられた。写真:ロイター・コネクト |
世界最大級のインターネットネットワークを運営するCloudflareの副社長、ウィル・アレン氏は、人間が生成したコンテンツの価値は、特に2022年まではより高まると指摘する。アレン氏によると、人間が生成したコンテンツはAIモデル、そして社会全体を共通の現実に結び付けるのに役立つという。この基盤がなければ、事態は複雑化する。
医学、法律、税務といった高度に技術的な分野では、背景知識は特に重要です。例えば医師は、AIによって生成された情報源ではなく、人間の専門家が書いたコンテンツや実際の研究に頼るべきです。
この危険性は現実味を帯びてきています。ChatGPTのローンチから1年後、ベンチャーキャピタリストのポール・グラハム氏は、「AIが生成したSEOの餌」を避けるため、簡単な検索でも古いコンテンツを探さなければならなかったと述べています。AIスタートアップ企業VercelのCTO、マルテ・ウブル氏は、グラハム氏は基本的に「AIに汚染される前の」インターネットコンテンツをフィルタリングしているだけだと反論しました。
元Googleエンジニアのマット・リカード氏も同意見だ。彼は2023年のブログ記事で、AIはインターネットから情報を得るが、インターネット上のコンテンツの多くはAIによって生成されるようになっていると述べている。「チャットボットの出力は検出が困難です。AIによって改ざんされていない学習データを見つけることはますます困難になるでしょう」とリカード氏は説明した。
「海底鋼鉄捜索」
この問題の解決策は、AIブーム以前に人間が生成したデータを保存することにあります。その先駆者の一人が、Cloudflareの取締役兼CTOであるジョン・グラハム=カミング氏です。
彼のプロジェクトであるウェブサイト LowBackgroundSteel.ai は、2022 年以前に存在していたデータセット、リンク、メディアをカタログ化しています。一例として、GitHub の Arctic Code Vault が挙げられます。これは、ノルウェーの廃炭鉱に埋められ、2020 年 2 月から保管されているオープンソース ソフトウェア リポジトリです。
グラハム・カミングスの「ヒューマンデータ保存プロジェクト」。写真: Lowbackgroundsteel.ai |
彼が挙げるもう一つのデータソースは「wordfreq」です。これは、オンライン上での単語の使用頻度を追跡するプロジェクトです。言語学者のロビン・スピア氏が2021年までこのプロジェクトを運営しています。
「生成AIはデータを汚染している」とスピア氏は述べた。彼女は、最近ますます頻繁に登場する「delve(掘り下げる)」という言葉に対するChatGPTの執着を例に挙げた。この言葉はインターネット上のデータを歪め、人間の書き方や思考の反映として信頼性を低下させている。
合成コンテンツで部分的に学習させたAIモデルは、ワークフローを高速化し、クリエイティブな作業における退屈さを解消することができます。しかし、パフォーマンスの向上以外にも、ユーザーは正確な測定のために「低地鋼材」を使用するなど、正確な判断を下すために人間が生成したコンテンツに頼らざるを得なくなるでしょう。
Business Insiderによると、科学者たちは純粋な酸素を使って鋼鉄を製造するさまざまな方法を開発した。これは、過去を保存することが信頼できる未来を築く唯一の方法かもしれないことを思い出させるものだ。
出典: https://znews.vn/thu-sap-thanh-hoai-niem-tren-internet-post1559151.html
コメント (0)