Une enquête menée par Proof News a révélé que ces entreprises utilisaient un ensemble de données créé par une organisation à but non lucratif appelée EleutherAI, qui contenait des enregistrements de contenu vidéo YouTube provenant de plus de 48 000 chaînes sans demander l'autorisation des propriétaires ou des créateurs de contenu.
Bien que l'ensemble de données ne contienne pas d'images ou de vidéos, le contenu est extrait des principaux créateurs de contenu de la plateforme, tels que Marques Brownlee et MrBeast, ainsi que des principaux éditeurs de nouvelles comme le New York Times, la BBC et ABC News. De plus, il existe des sous-titres provenant de vidéos appartenant à Engadget.
« Apple obtient des données pour son IA auprès de plusieurs entreprises », a déclaré Brownlee, un YouTubeur populaire, sur X. « L'une d'elles est constituée de tonnes de données/enregistrements de vidéos YouTube, dont les miennes. »
Auparavant, le PDG de YouTube, Neal Mohan, avait affirmé que l'utilisation par les entreprises des données YouTube pour former des modèles d'IA constituait une violation des conditions générales de la plateforme.
Actuellement, les entreprises d’IA ne sont pas transparentes sur les données utilisées pour former les algorithmes. Plus tôt ce mois-ci, des artistes et des photographes ont critiqué Apple pour ne pas avoir divulgué la source des données de formation d’Apple Intelligence, une nouvelle fonctionnalité d’IA qui sera disponible sur des millions d’appareils Apple cette année.
YouTube, le plus grand référentiel vidéo au monde, est également une mine d'or de données pour la formation de l'IA, notamment des transcriptions, de l'audio, de la vidéo et des images.
Plus tôt cette année, Mira Murati, directrice technique d’OpenAI, a esquivé les questions du Wall Street Journal sur la question de savoir si l’entreprise utilisait des vidéos YouTube pour former Sora, le prochain outil de création vidéo IA d’OpenAI.
« Je n’entrerai pas dans les détails des données qui ont été utilisées, mais il s’agissait de données sous licence ou accessibles au public », avait déclaré Murati à l’époque. Dans le même temps, le PDG d'Alphabet, Sundar Pichai, a également souligné que les entreprises utilisant les données de YouTube pour former des modèles d'IA violaient les conditions de service de la plateforme.
(Selon Proof News, WSJ)
Source : https://vietnamnet.vn/apple-nvidia-va-anthropic-su-dung-trai-phep-du-lieu-youtube-de-dao-tao-ai-2303028.html
Comment (0)