Расследование Proof News выявило, что эти компании использовали набор данных, созданный некоммерческой организацией EleutherAI, содержащий записи видеоконтента YouTube с более чем 48 000 каналов, без получения разрешения от владельцев или создателей контента.

Хотя набор данных не содержит изображений или видео, контент получен от ведущих создателей контента на платформе, таких как Маркес Браунли и MrBeast, а также от крупных новостных изданий, таких как The New York Times, BBC и ABC News. Кроме того, он включает субтитры к видео, принадлежащим Engadget.

8d541010 38d9 11ef b7fd 2183e5dd7ce6.jpg
Компания Apple Intelligence обвиняется в незаконном использовании данных сообщества создателей контента на YouTube. Фото: Yahoo Tech.

«Apple получает данные для своего ИИ от ряда компаний», — написал популярный ютубер Браунли на X. «Одна из них — это огромное количество данных/записей из видео на YouTube, включая мои».

Ранее генеральный директор YouTube Нил Мохан заявил, что компании, использующие данные YouTube для обучения моделей искусственного интеллекта, нарушают условия использования платформы.

В настоящее время компании, занимающиеся искусственным интеллектом, по-прежнему не проявляют прозрачности в отношении данных, используемых для обучения своих алгоритмов. Ранее в этом месяце художники и фотографы раскритиковали Apple за то, что компания не раскрыла источники данных, использованных для обучения Apple Intelligence — новой функции ИИ, которая станет доступна на миллионах устройств Apple в этом году.

YouTube, крупнейшая в мире платформа для размещения видео, также является настоящей «золотой жилой» для обучения искусственного интеллекта, поскольку включает в себя записи, аудио, видео и изображения.

Ранее в этом году технический директор OpenAI Мира Мурати уклонилась от вопросов The Wall Street Journal о том, использовала ли компания видеоролики с YouTube для обучения Sora, будущего инструмента OpenAI для создания видео с помощью ИИ.

«Я не буду вдаваться в подробности об использованных данных, но это были лицензированные или общедоступные данные», — сказал тогда Мурати. Между тем, генеральный директор Alphabet Сундар Пичаи также подчеркнул, что компании, использующие данные с YouTube для обучения моделей ИИ, нарушают условия использования платформы.

(По данным Proof News, WSJ)

Apple и Samsung обогнали китайские бренды смартфонов . Данные Counterpoint Research показывают, что мировой рынок смартфонов вырос на 6% во втором квартале 2024 года, при этом Apple и Samsung заняли первые два места, за ними следуют китайские бренды, такие как Xiaomi, Vivo и Oppo.