Une enquête menée par Proof News a révélé que ces entreprises ont utilisé un ensemble de données créé par l'organisation à but non lucratif EleutherAI, contenant des enregistrements de contenu vidéo YouTube provenant de plus de 48 000 chaînes, sans obtenir l'autorisation des propriétaires ou des créateurs de contenu.
Bien que l'ensemble de données ne contienne ni images ni vidéos, son contenu provient de créateurs de contenu influents de la plateforme, tels que Marques Brownlee et MrBeast, ainsi que de grands médias comme le New York Times, la BBC et ABC News. Il inclut également les sous-titres de vidéos d'Engadget.

« Apple obtient des données pour son IA auprès de plusieurs entreprises », a écrit Brownlee, un YouTubeur populaire, sur X. « Parmi elles, une quantité considérable de données/enregistrements provenant de vidéos YouTube, y compris les miennes. »
Auparavant, le PDG de YouTube, Neal Mohan, avait affirmé que les entreprises utilisant les données de YouTube pour entraîner des modèles d'IA violaient les conditions d'utilisation de la plateforme.
À l'heure actuelle, les entreprises spécialisées en IA manquent encore de transparence quant aux données utilisées pour entraîner leurs algorithmes. Plus tôt ce mois-ci, des artistes et des photographes ont critiqué Apple pour ne pas avoir divulgué les sources de données utilisées pour entraîner Apple Intelligence, une nouvelle fonctionnalité d'IA qui sera disponible sur des millions d'appareils Apple cette année.
YouTube, la plus grande plateforme d'hébergement vidéo au monde , est également une véritable mine d'or de données pour l'entraînement de l'IA, puisqu'elle comprend des enregistrements audio, vidéo et des images.
Plus tôt cette année, la directrice technique d'OpenAI, Mira Murati, a esquivé les questions du Wall Street Journal concernant l'utilisation par l'entreprise de vidéos YouTube pour entraîner Sora, le futur outil de création vidéo par IA d'OpenAI.
« Je ne donnerai pas de détails sur les données utilisées, mais il s'agissait de données sous licence ou accessibles au public », avait déclaré Murati à l'époque. Parallèlement, Sundar Pichai, PDG d'Alphabet, avait également souligné que les entreprises utilisant des données de YouTube pour entraîner des modèles d'IA violaient les conditions d'utilisation de la plateforme.
(Selon Proof News, WSJ)
Source : https://vietnamnet.vn/apple-nvidia-va-anthropic-su-dung-trai-phep-du-lieu-youtube-de-dao-tao-ai-2303028.html






Comment (0)