Una investigación de Proof News descubrió que estas empresas utilizaron un conjunto de datos creado por una organización sin fines de lucro llamada EleutherAI, que contenía grabaciones de contenido de video de YouTube de más de 48.000 canales sin pedir permiso a los propietarios o creadores del contenido.
Si bien el conjunto de datos no contiene imágenes ni videos, sí incluye contenido de los principales creadores de la plataforma, como Marques Brownlee y MrBeast, así como de importantes medios de comunicación como The New York Times, BBC y ABC News. También incluye subtítulos de videos propiedad de Engadget.
«Apple obtiene datos para su IA de varias empresas», publicó Brownlee, un popular YouTuber, en X. «Una de ellas son toneladas de datos/grabaciones de vídeos de YouTube, incluidos los míos».
Anteriormente, el CEO de YouTube, Neal Mohan, afirmó que el uso de datos de YouTube por parte de las empresas para entrenar modelos de IA constituye una violación de los términos y servicios de la plataforma.
Las empresas de IA aún no han sido transparentes sobre los datos que utilizan para entrenar sus algoritmos. A principios de este mes, artistas y fotógrafos criticaron a Apple por no revelar los datos de entrenamiento de Apple Intelligence, una nueva función de IA que estará disponible en millones de dispositivos Apple este año.
YouTube, el repositorio de videos más grande del mundo , también es una mina de oro de datos para entrenar IA, incluidas transcripciones, audio, videos e imágenes.
A principios de este año, la directora de tecnología de OpenAI, Mira Murati, esquivó las preguntas de The Wall Street Journal sobre si la empresa utilizó videos de YouTube para entrenar a Sora, la próxima herramienta de creación de videos de IA de OpenAI.
"No entraré en detalles sobre los datos utilizados, pero eran datos con licencia o disponibles públicamente", declaró Murati en aquel momento. Por su parte, el director ejecutivo de Alphabet, Sundar Pichai, también enfatizó que las empresas que utilizan datos de YouTube para entrenar modelos de IA están infringiendo las condiciones de servicio de la plataforma.
(Según Proof News, WSJ)
[anuncio_2]
Fuente: https://vietnamnet.vn/apple-nvidia-va-anthropic-su-dung-trai-phep-du-lieu-youtube-de-dao-tao-ai-2303028.html
Kommentar (0)