Una investigación de Proof News descubrió que estas empresas utilizaron un conjunto de datos creado por una organización sin fines de lucro llamada EleutherAI, que contenía grabaciones de contenido de video de YouTube de más de 48.000 canales sin pedir permiso a los propietarios o creadores del contenido.
Si bien el conjunto de datos no contiene imágenes ni videos, el contenido se extrae de los principales creadores de contenido de la plataforma, como Marques Brownlee y MrBeast, así como de los principales editores de noticias como The New York Times, BBC y ABC News. Además, hay subtítulos de vídeos propiedad de Engadget.
«Apple obtiene datos para su IA de varias empresas», publicó Brownlee, un popular YouTuber, en X. «Una de ellas son toneladas de datos/grabaciones de vídeos de YouTube, incluidos los míos».
Anteriormente, el CEO de YouTube, Neal Mohan, afirmó que el uso de datos de YouTube por parte de las empresas para entrenar modelos de IA constituye una violación de los términos y servicios de la plataforma.
Actualmente, las empresas de IA no son transparentes sobre los datos que utilizan para entrenar algoritmos. A principios de este mes, artistas y fotógrafos criticaron a Apple por no revelar la fuente de datos de entrenamiento para Apple Intelligence, una nueva función de IA que estará disponible en millones de dispositivos Apple este año.
YouTube, el repositorio de videos más grande del mundo, también es una mina de oro de datos para entrenar IA, incluidas transcripciones, audio, videos e imágenes.
A principios de este año, la directora de tecnología de OpenAI, Mira Murati, esquivó las preguntas de The Wall Street Journal sobre si la empresa utilizó videos de YouTube para entrenar a Sora, la próxima herramienta de creación de videos de IA de OpenAI.
"No entraré en detalles sobre los datos que se utilizaron, pero eran datos autorizados o disponibles públicamente", dijo Murati en ese momento. Mientras tanto, el CEO de Alphabet, Sundar Pichai, también enfatizó que las empresas que utilizan datos de YouTube para entrenar modelos de IA están violando los términos de servicio de la plataforma.
(Según Proof News, WSJ)
[anuncio_2]
Fuente: https://vietnamnet.vn/apple-nvidia-va-anthropic-su-dung-trai-phep-du-lieu-youtube-de-dao-tao-ai-2303028.html
Kommentar (0)