Proof News의 조사에 따르면, 이러한 회사는 콘텐츠 소유자나 제작자의 허가를 받지 않고 EleutherAI라는 비영리 단체가 만든 데이터 세트를 사용했는데, 이 데이터 세트에는 48,000개 이상의 채널에서 YouTube 비디오 콘텐츠를 녹화한 내용이 들어 있었습니다.

데이터 세트에는 이미지나 비디오가 포함되어 있지 않지만, 콘텐츠는 Marques Brownlee, MrBeast와 같은 플랫폼의 최고 콘텐츠 제작자와 The New York Times, BBC, ABC News와 같은 주요 뉴스 출판사로부터 수집됩니다. 또한 Engadget이 소유한 비디오의 자막도 제공됩니다.

8d541010 38d9 11ef b7fd 2183e5dd7ce6.jpg
Apple Intelligence가 YouTube 크리에이티브 커뮤니티의 데이터를 불법적으로 사용한 혐의를 받았습니다. 사진: 야후 테크

인기 유튜버 브라운리는 X에 "애플은 여러 회사로부터 AI 관련 데이터를 얻는다"고 게시했다. "그 중 하나는 제 영상을 포함해 유튜브 영상에서 수집한 엄청난 양의 데이터/녹음 자료다."

이전에 YouTube CEO인 닐 모한은 YouTube 데이터를 사용하여 AI 모델을 훈련하는 회사는 플랫폼의 이용 약관과 서비스를 위반한다고 단언했습니다.

현재 AI 회사들은 알고리즘을 훈련하는 데 사용되는 데이터에 대해 투명하지 않습니다. 이번 달 초, 예술가와 사진작가들은 Apple Intelligence에 대한 훈련 데이터 소스를 공개하지 않은 Apple을 비판했습니다. Apple Intelligence는 올해 수백만 대의 Apple 기기에 적용될 새로운 AI 기능입니다.

세계 최대의 동영상 저장소인 YouTube는 대본, 오디오, 비디오, 이미지 등 AI 훈련을 위한 데이터의 보고이기도 합니다.

올해 초, OpenAI의 최고기술책임자(CTO)인 미라 무라티는 월스트리트 저널에서 OpenAI의 차기 AI 비디오 제작 도구인 소라(Sora)를 훈련시키는 데 YouTube 동영상을 사용했는지에 대한 질문을 회피했습니다.

무라티는 당시 "사용된 데이터에 대한 자세한 내용은 밝히지 않겠지만, 라이선스를 받았거나 공개적으로 이용 가능한 데이터였습니다."라고 말했습니다. 한편, 알파벳 CEO 순다르 피차이는 유튜브의 데이터를 활용해 AI 모델을 훈련하는 회사들이 플랫폼의 서비스 약관을 위반하고 있다고 강조했습니다.

(Proof News, WSJ에 따르면)

Apple과 Samsung이 중국 스마트폰 브랜드를 앞지르다 Counterpoint Research의 데이터에 따르면 2024년 2분기에 글로벌 스마트폰 시장은 6% 성장하여 Apple과 Samsung이 1, 2위를 차지했고, Xiaomi, Vivo, Oppo 등 중국 브랜드가 그 뒤를 이었습니다.