Une enquête menée par Proof News a révélé que ces entreprises utilisaient un ensemble de données créé par une organisation à but non lucratif appelée EleutherAI, qui contenait des enregistrements de contenu vidéo YouTube provenant de plus de 48 000 chaînes sans demander l'autorisation des propriétaires ou des créateurs de contenu.

Bien que l'ensemble de données ne contienne ni images ni vidéos, il inclut du contenu provenant des principaux créateurs de la plateforme, tels que Marques Brownlee et MrBeast, ainsi que de grands éditeurs de presse comme le New York Times, la BBC et ABC News. Il inclut également les sous-titres des vidéos appartenant à Engadget.

8d541010 38d9 11ef b7fd 2183e5dd7ce6.jpg
Apple Intelligence accusée d'avoir utilisé illégalement les données de la communauté créative de YouTube. Photo : Yahoo Tech

« Apple obtient des données pour son IA auprès de plusieurs entreprises », a déclaré Brownlee, un YouTubeur populaire, sur X. « L'une d'elles est constituée de tonnes de données/enregistrements de vidéos YouTube, dont les miennes. »

Auparavant, le PDG de YouTube, Neal Mohan, avait affirmé que l'utilisation par les entreprises des données YouTube pour former des modèles d'IA constituait une violation des conditions générales de la plateforme.

Les entreprises d'IA manquent encore de transparence sur les données qu'elles utilisent pour entraîner leurs algorithmes. Plus tôt ce mois-ci, des artistes et des photographes ont critiqué Apple pour ne pas avoir divulgué les données d'entraînement d'Apple Intelligence, une nouvelle fonctionnalité d'IA qui sera disponible sur des millions d'appareils Apple cette année.

YouTube, le plus grand référentiel vidéo au monde , est également une mine d'or de données pour la formation de l'IA, notamment des transcriptions, de l'audio, de la vidéo et des images.

Plus tôt cette année, Mira Murati, directrice technique d’OpenAI, a esquivé les questions du Wall Street Journal sur la question de savoir si l’entreprise utilisait des vidéos YouTube pour former Sora, le prochain outil de création vidéo IA d’OpenAI.

« Je n'entrerai pas dans les détails des données utilisées, mais il s'agissait de données sous licence ou accessibles au public », avait déclaré Murati à l'époque. Sundar Pichai, PDG d'Alphabet, avait également souligné que les entreprises utilisant les données de YouTube pour entraîner des modèles d'IA violaient les conditions d'utilisation de la plateforme.

(Selon Proof News, WSJ)

Apple et Samsung surpassent les marques chinoises de smartphones Les données de Counterpoint Research montrent que le marché mondial des smartphones a augmenté de 6 % au deuxième trimestre 2024, Apple et Samsung occupant les deux premières positions, suivis de marques chinoises telles que Xiaomi, Vivo et Oppo.