Ряд компаний, занимающихся разработкой искусственного интеллекта, обвиняются в незаконном сборе данных

Разработчики ИИ используют сбор больших объёмов данных из множества различных источников для создания крупных языковых моделей. Эта технология лежит в основе таких чат-ботов, как ChatGPT от OpenAI и конкурент Claude от Anthropic.

Компания Anthropic была основана группой бывших исследователей OpenAI с целью разработки «ответственных» систем ИИ.

Однако Мэтт Барри, генеральный директор Freelancer.com, обвинил компанию из Сан-Франциско во взломе портала журналистов-фрилансеров, который ежедневно посещают миллионы человек.

Ряд компаний обвиняются в незаконном сборе данных, фото 1 — Компания Anthropic создала одни из самых продвинутых чат-ботов в мире , соперничающих с ChatGPT от OpenAI. Фото: Якуб Пожицкий

По данным, предоставленным Financial Times, Freelancer.com получил 3,5 миллиона посещений от веб-«паучьего робота», связанного с Anthropic, в течение четырех часов.

Барри добавил, что трафик от этих ботов продолжал расти даже после того, как Freelancer.com попытался отклонить запросы на доступ, используя стандартные веб-протоколы для передачи инструкций роботу. После этого Барри решил полностью заблокировать трафик с интернет-адресов Anthropic.

Кайл Винс, генеральный директор iFixit.com, сообщил, что его сайт по ремонту электроники получил 1 миллион посещений от ботов Anthropic за 24 часа. «Мы получили много оповещений (из-за большого трафика)», — сказал он.

Венс заявил, что условия обслуживания iFixit запрещают использование его данных для машинного обучения. «Моё первое сообщение Anthropic: если вы используете эти данные для обучения своей модели, это незаконно. Моё второе сообщение: это невежливое поведение в интернете», — сказал он.

Сбор данных — не новая тема, но за последние два года он значительно увеличился в связи с развитием искусственного интеллекта. Это привело к новым расходам для веб-сайтов.

Ряд компаний были обвинены в незаконном сборе данных, изображение 2 — Действия социальной сети X по автоматическому сбору данных пользователей для обучения чат-ботов могут нарушать европейские правила конфиденциальности. Фото: Reuters

Европейский орган по защите данных расследует решение социальной сети X разрешить автоматическую передачу пользовательских данных стартапу в области искусственного интеллекта xAI.

В частности, 26 июля пользователи X обнаружили, что они случайно позволили использовать свои сообщения и взаимодействия с чат-ботом Grok для «обучения и совершенствования» систем xAI.

Этот шаг был предпринят без явного согласия пользователей на обмен данными. Настройки нельзя изменить в мобильном приложении X, только в десктопной версии.

Эксперты по защите персональных данных сомневаются, что действия X нарушают положения Общего регламента ЕС по защите данных, который обязывает компании, собирающие или использующие персональные данные, предварительно получать согласие пользователя и раскрывать причины таких действий. Если ирландские регуляторы начнут расследование, X может быть оштрафована или подвергнута взысканиям.

В прошлом месяце компания Meta приостановила свои планы по обучению ИИ на данных платформ Facebook и Instagram в Европе после получения запроса от ирландского DPC о проблемах с соблюдением GDPR. Meta заявила, что это стало «откатом для европейских инноваций и конкуренции в области разработки ИИ».

Нгок Ань (по данным FT)

Источник: https://www.congluan.vn/hang-loat-cong-ty-ai-bi-cao-buoc-thu-thap-du-lieu-trai-phep-post305394.html