Une enquête menée par Proof News a révélé que ces entreprises utilisaient un ensemble de données créé par une société à but non lucratif appelée EleutherAI, qui contenait des enregistrements de contenu vidéo YouTube provenant de plus de 48 000 chaînes sans demander l'autorisation des propriétaires ou des créateurs de contenu.

Bien que l'ensemble de données ne contienne ni images ni vidéos, il inclut du contenu provenant des principaux créateurs de contenu de la plateforme, tels que Marques Brownlee et MrBeast, ainsi que de grands éditeurs de presse comme le New York Times, la BBC et ABC News. Il inclut également les sous-titres des vidéos appartenant à Engadget.

8d541010 38d9 11ef b7fd 2183e5dd7ce6.jpg
Apple Intelligence accusée d'avoir utilisé illégalement les données de la communauté créative de YouTube. Photo : Yahoo Tech

« Apple obtient des données pour son IA auprès de plusieurs entreprises », a déclaré Brownlee, un YouTubeur populaire, sur X. « L'une d'elles est constituée de tonnes de données/enregistrements de vidéos YouTube, dont les miennes. »

Auparavant, le PDG de YouTube, Neal Mohan, avait affirmé que les entreprises utilisant les données YouTube pour former des modèles d'IA constituaient une violation des conditions générales de la plateforme.

Les entreprises d'IA manquent encore de transparence sur les données qu'elles utilisent pour entraîner leurs algorithmes. Plus tôt ce mois-ci, des artistes et des photographes ont critiqué Apple pour ne pas avoir divulgué les données d'entraînement d'Apple Intelligence, une nouvelle fonctionnalité d'IA qui sera disponible sur des millions d'appareils Apple cette année.

YouTube, le plus grand référentiel vidéo au monde , est également une mine d'or de données pour la formation de l'IA, notamment des transcriptions, de l'audio, de la vidéo et des images.

Plus tôt cette année, Mira Murati, directrice technique d'OpenAI, a esquivé les questions du Wall Street Journal sur la question de savoir si la société utilisait des vidéos YouTube pour former Sora, le prochain outil de création de vidéos IA d'OpenAI.

« Je n'entrerai pas dans les détails des données utilisées, mais il s'agissait de données sous licence ou accessibles au public », avait déclaré Murati à l'époque. Sundar Pichai, PDG d'Alphabet, a également souligné que l'utilisation des données de YouTube pour entraîner des modèles d'IA par les entreprises enfreignait les conditions d'utilisation de la plateforme.

(Selon Proof News, WSJ)

Apple et Samsung surpassent les marques de smartphones chinoises Les données de Counterpoint Research montrent que le marché mondial des smartphones a augmenté de 6 % au deuxième trimestre 2024, Apple et Samsung occupant les deux premières positions, suivis de marques chinoises telles que Xiaomi, Vivo et Oppo.