Proof News의 조사에 따르면, 이러한 회사는 콘텐츠 소유자나 제작자의 허가를 받지 않고 EleutherAI라는 비영리 단체가 만든 데이터 세트를 사용했는데, 이 데이터 세트에는 48,000개 이상의 채널에서 YouTube 비디오 콘텐츠를 녹화한 내용이 들어 있었습니다.

이 데이터 세트에는 이미지나 비디오는 포함되어 있지 않지만, Marques Brownlee, MrBeast 등 플랫폼 내 유명 크리에이터들과 뉴욕 타임스, BBC, ABC 뉴스 등 주요 언론사의 콘텐츠가 포함되어 있습니다. 또한 Engadget이 소유한 비디오의 자막도 포함되어 있습니다.

8d541010 38d9 11ef b7fd 2183e5dd7ce6.jpg
Apple Intelligence가 YouTube 크리에이터 커뮤니티 데이터를 불법적으로 사용한 혐의를 받고 있습니다. 사진: Yahoo Tech

인기 유튜버 브라운리는 X에 "애플은 여러 회사로부터 AI 관련 데이터를 얻는다"고 게시했다. "그 중 하나는 제 영상을 포함해 유튜브 영상에서 수집한 엄청난 양의 데이터/녹음 자료다."

이전에 YouTube CEO인 닐 모한은 YouTube 데이터를 사용하여 AI 모델을 훈련하는 회사는 플랫폼의 이용 약관과 서비스를 위반한다고 단언했습니다.

AI 기업들은 아직 알고리즘 학습에 사용하는 데이터에 대해 투명하게 공개하지 않고 있습니다. 이달 초, 예술가와 사진작가들은 애플이 올해 수백만 대의 애플 기기에 탑재될 새로운 AI 기능인 애플 인텔리전스의 학습 데이터를 공개하지 않았다고 비판했습니다.

세계 최대의 동영상 저장소인 YouTube는 대본, 오디오, 비디오, 이미지 등 AI 훈련을 위한 데이터의 보고이기도 합니다.

올해 초, OpenAI의 최고기술책임자(CTO)인 미라 무라티는 월스트리트 저널에서 OpenAI의 차기 AI 비디오 제작 도구인 소라(Sora)를 훈련시키는 데 YouTube 동영상을 사용했는지에 대한 질문을 회피했습니다.

무라티는 당시 "사용된 데이터에 대한 자세한 내용은 언급하지 않겠지만, 라이선스를 받았거나 공개적으로 이용 가능한 데이터였습니다."라고 말했습니다. 한편, 알파벳 CEO 순다르 피차이는 유튜브 데이터를 사용하여 AI 모델을 훈련하는 기업들이 플랫폼 서비스 약관을 위반하고 있다고 강조했습니다.

(Proof News, WSJ에 따르면)

Apple과 Samsung이 중국 스마트폰 브랜드를 앞지르다 Counterpoint Research의 데이터에 따르면 2024년 2분기에 글로벌 스마트폰 시장은 6% 성장하여 Apple과 Samsung이 1, 2위를 차지했고, Xiaomi, Vivo, Oppo 등 중국 브랜드가 그 뒤를 이었습니다.