Proof News의 조사에 따르면, 이 회사들은 비영리 단체인 EleutherAI가 제작한 48,000개 이상의 유튜브 채널 영상 녹화 데이터셋을 소유자나 콘텐츠 제작자의 허가 없이 사용한 것으로 드러났습니다.
이 데이터 세트에는 이미지나 동영상이 포함되어 있지 않지만, 마르케스 브라운리(Marques Brownlee)와 미스터비스트(MrBeast)와 같은 플랫폼의 유명 콘텐츠 제작자와 뉴욕 타임스, BBC, ABC 뉴스 등 주요 뉴스 매체의 콘텐츠를 포함하고 있습니다. 또한, Engadget의 동영상 자막도 포함되어 있습니다.

인기 유튜버 브라운리는 X에 "애플은 여러 회사로부터 AI용 데이터를 얻는데, 그중 하나가 내 영상을 포함한 유튜브 영상의 수많은 데이터/기록"이라고 게시했다.
앞서 유튜브 CEO 닐 모한은 유튜브 데이터를 이용해 AI 모델을 학습시키는 기업들이 플랫폼 이용약관을 위반했다고 주장한 바 있다.
현재 AI 기업들은 알고리즘 학습에 사용된 데이터에 대해 투명하게 공개하지 않고 있습니다. 이달 초, 예술가와 사진작가들은 애플이 올해 수백만 대의 애플 기기에 탑재될 새로운 AI 기능인 애플 인텔리전스 학습에 사용된 데이터 소스를 공개하지 않은 것을 비판했습니다.
세계 최대 동영상 호스팅 플랫폼인 유튜브는 녹화 영상, 오디오, 비디오, 이미지 등 다양한 콘텐츠를 보유하고 있어 인공지능 학습을 위한 "데이터의 보고"이기도 합니다.
올해 초, 오픈아이(OpenAI)의 최고기술책임자(CTO)인 미라 무라티는 월스트리트저널이 자사의 차세대 AI 비디오 제작 도구인 소라(Sora)를 학습시키는 데 유튜브 영상을 사용했는지 여부에 대해 제기한 질문에 답변을 회피했습니다.
무라티는 당시 "사용된 데이터에 대한 자세한 내용은 밝히지 않겠지만, 라이선스를 취득했거나 공개적으로 이용 가능한 데이터였다"고 말했다. 한편, 알파벳 CEO 순다르 피차이 역시 유튜브의 데이터를 이용해 AI 모델을 학습시키는 기업들은 플랫폼 이용약관을 위반하는 것이라고 강조했다.
(프루프 뉴스, 월스트리트저널 보도에 따르면)
[광고_2]
출처: https://vietnamnet.vn/apple-nvidia-va-anthropic-su-dung-trai-phep-du-lieu-youtube-de-dao-tao-ai-2303028.html






댓글 (0)