Разработчики ИИ полагаются на сбор больших объемов данных из различных источников для создания больших языковых моделей. Это технология, лежащая в основе чат-ботов, таких как ChatGPT от OpenAI и конкурент Claude от Anthropic.
Компания Anthropic была основана группой бывших исследователей OpenAI с целью разработки «ответственных» систем ИИ.
Однако Мэтт Барри, генеральный директор Freelancer.com, обвинил компанию из Сан-Франциско во взломе портала внештатной журналистики, который ежедневно посещают миллионы человек.
Компания Anthropic создала одни из самых продвинутых в мире чат-ботов, конкурирующих с ChatGPT от OpenAI. Фото: Якуб Пожицкий
По данным, предоставленным Financial Times, Freelancer.com получил 3,5 миллиона посещений от веб-«паука», связанного с Anthropic, в течение четырех часов.
Барри добавил, что трафик от этих ботов продолжал расти даже после того, как Freelancer.com попытался отклонить запросы, используя стандартные веб-протоколы для указания краулеру. Затем Барри решил полностью заблокировать трафик с интернет-адресов Anthropic.
Кайл Винс, генеральный директор iFixit.com, сказал, что его сайт по ремонту электроники получил 1 миллион посещений от ботов Anthropic за 24 часа. «У нас было много оповещений (из-за большого трафика)», — сказал он.
Венс сказал, что условия обслуживания iFixit запрещают использование их данных для целей машинного обучения. «Мое первое сообщение Anthropic: если вы используете эти данные для обучения своей модели, это незаконно. Мое второе сообщение: это невежливое поведение в Интернете», — сказал он.
Сбор данных не является чем-то новым, но он резко возрос за последние два года из-за гонки ИИ. Это создало новые расходы для веб-сайтов.
Действия социальной сети X по автоматическому сбору данных пользователей для обучения чат-ботов могут нарушать европейские правила конфиденциальности. Фото: Reuters
Европейский орган по защите данных расследует решение социальной сети X разрешить автоматическую передачу данных пользователей стартапу в области искусственного интеллекта xAI.
В частности, 26 июля пользователи X обнаружили, что они случайно позволили использовать свои сообщения и взаимодействия с чат-ботом Grok для «обучения и совершенствования» систем xAI.
Этот шаг был сделан без явного согласия пользователя на обмен данными. Настройка не может быть изменена в мобильном приложении X, только в версии для настольного компьютера.
Эксперты по конфиденциальности задаются вопросом, нарушает ли шаг X правила Общего регламента ЕС по защите данных, который требует, чтобы компании, собирающие или использующие персональные данные, сначала получали согласие человека и раскрывали, почему они это делают. Если ирландский регулятор начнет расследование, X может столкнуться со штрафами или взысканиями.
В прошлом месяце Meta приостановила свои планы по обучению ИИ на данных с платформ Facebook и Instagram в Европе после получения запроса от ирландского DPC относительно проблем с соблюдением GDPR. Meta заявила, что это стало «откатом назад для европейских инноваций и конкуренции в разработке ИИ».
Нгок Ань (по данным FT)
Источник: https://www.congluan.vn/hang-loat-cong-ty-ai-bi-cao-buoc-thu-thap-du-lieu-trai-phep-post305394.html
Комментарий (0)