Vietnam.vn - Nền tảng quảng bá Việt Nam

Что-то, что скоро станет предметом интернет-ностальгии

Бурный рост контента, созданного с помощью искусственного интеллекта, создал проблему доверия, поскольку чисто человеческих данных становится все меньше.

ZNewsZNews09/06/2025

Чисто человеческий контент в дефиците в эпоху ИИ. Фото: Advertising Week .

Появление ChatGPT в 2022 году приведет к взрыву контента искусственного интеллекта в Интернете. Согласно прогнозу Gartner, к 2026 году 90% контента в Интернете будет генерироваться ИИ, включая текст, изображения и видео .

ИИ обучен понимать человеческую мысль. Но без чистых данных, сгенерированных человеком, технология будет использовать свою собственную старую информацию, как копировальный аппарат, воспроизводящий сам себя.

Многие исследователи сравнивают оригинальный контент, созданный человеком, с современной «чистой» сталью, редким и труднодоступным эквивалентом. Они опасаются, что если никто не сохранит копии данных до 2022 года, интернет полностью потеряет свою чистоту.

Реконструкция исторической катастрофы

В постъядерную эпоху ученые обнаружили, что вся сталь, произведенная после 1945 года, загрязнена. Атомные бомбы загрязнили атмосферу радиацией, которая распространилась на металлы, произведенные в этой среде.

Это делает большую часть стали непригодной для высокоточного измерительного оборудования, такого как счетчики Гейгера и другие чувствительные датчики. Решение состоит в том, чтобы спасти старую сталь с затонувших военных кораблей глубоко на дне океана, где она не подвержена воздействию радиоактивных осадков.

Для разработчиков ИИ большинство моделей обучаются на огромных массивах человеческих данных, собранных в Интернете. Но если сегодняшнее программное обеспечение учится на тексте, который оно сгенерировало в прошлом, модели рискуют развалиться, что ослабит их оригинальность и глубину.

Noi dung dang tin cay anh 1

Затонувший линкор времен Первой мировой войны «Гинденбург» был спасен. Фото: Reuters Connect.

Это делает контент, созданный человеком, особенно до 2022 года, более ценным, говорит Уилл Аллен, вице-президент Cloudflare, которая управляет одной из крупнейших в мире интернет-сетей. Он говорит, что это помогает привязать модели ИИ и общество в целом к ​​общей реальности. Без этой основы все становится сложнее.

Фон особенно важен в таких высокотехнологичных областях, как медицина, юриспруденция или налогообложение. Например, врач должен полагаться на контент, написанный экспертами-людьми, и на реальные исследования, а не на источники, созданные ИИ.

Эта опасность также становится все более реальной. Через год после запуска ChatGPT венчурный капиталист Пол Грэм сказал, что ему пришлось искать старый контент для простого поиска, чтобы избежать «приманки SEO, созданной ИИ». Мальте Убл, технический директор стартапа Vercel, занимающегося ИИ, ответил, что Грэм по сути фильтрует интернет на предмет контента «до того, как он был заражен ИИ».

Мэтт Рикард, бывший инженер Google, согласен. Он написал в блоге от 2023 года, что ИИ питается из интернета, но все больше и больше контента в нем генерируется ИИ. «Выходные данные чат-ботов трудно обнаружить. Найти обучающие данные, которые не были изменены ИИ, будет становиться все сложнее», — объяснил Рикард.

«Поиск стали на морском дне»

Ответ на эту проблему заключается в сохранении версии данных, созданных человеком, до бума ИИ. Одним из пионеров является Джон Грэм-Камминг, член совета директоров и технический директор Cloudflare.

Его проект, веб-сайт LowBackgroundSteel.ai, каталогизирует наборы данных, ссылки и медиафайлы, существовавшие до 2022 года. Одним из примеров является Arctic Code Vault от GitHub, репозиторий программного обеспечения с открытым исходным кодом, зарытый в заброшенной угольной шахте в Норвегии, который хранится с февраля 2020 года.

Noi dung dang tin cay anh 2

Проект Грэма-Камминга по сохранению человеческих данных. Фото: Lowbackgroundsteel.ai.

Другой источник данных, который он перечисляет, — это «wordfreq», проект, который отслеживает, как часто слова используются в сети. Лингвист Робин Спир поддерживала его до 2021 года.

«Генеративный ИИ загрязнил данные», — сказала Спир. В качестве примера она привела одержимость ChatGPT словом «delve», которое в последнее время появляется все чаще. Это искажает данные в интернете, делая их менее надежными как отражение того, как люди пишут и думают.

Модели ИИ, частично обученные на синтетическом контенте, могут ускорить рабочие процессы и устранить скуку в творческой работе. Но помимо производительности пользователям, скорее всего, придется полагаться на созданный человеком контент для принятия точных суждений, например, использовать «низкопрофильную сталь» для точных измерений.

По данным Business Insider , ученые разработали различные методы производства стали с использованием чистого кислорода, что является напоминанием о том, что сохранение прошлого может быть единственным способом построить надежное будущее.

Источник: https://znews.vn/thu-sap-thanh-hoai-niem-tren-internet-post1559151.html


Комментарий (0)

No data
No data

Та же категория

Вьетнам - Польша рисует «симфонию света» в небе Дананга
Прибрежный деревянный мост Тханьхоа производит фурор благодаря своему прекрасному виду на закат, как на Фукуоке.
Красота женщин-солдат с квадратными звездами и южных партизан под летним солнцем столицы
Сезон лесного фестиваля в Кукфыонг

Тот же автор

Наследство

Фигура

Бизнес

No videos available

Новости

Политическая система

Местный

Продукт