จากการตรวจสอบของ Proof News พบว่าบริษัทเหล่านี้ใช้ชุดข้อมูลที่สร้างโดยองค์กรไม่แสวงผลกำไร EleutherAI ซึ่งประกอบด้วยบันทึก วิดีโอ จาก YouTube กว่า 48,000 ช่อง โดยไม่ได้รับอนุญาตจากเจ้าของหรือผู้สร้างเนื้อหา
แม้ว่าชุดข้อมูลนี้จะไม่มีรูปภาพหรือวิดีโอ แต่เนื้อหามาจากผู้สร้างเนื้อหาชั้นนำบนแพลตฟอร์ม เช่น Marques Brownlee และ MrBeast รวมถึงสำนักข่าวใหญ่ๆ เช่น The New York Times, BBC และ ABC News นอกจากนี้ยังรวมถึงคำบรรยายจากวิดีโอของ Engadget ด้วย

"Apple ได้รับข้อมูลสำหรับ AI จากหลายบริษัท" บราวน์ลี ยูทูบเบอร์ชื่อดัง โพสต์บน X "หนึ่งในนั้นคือข้อมูล/บันทึกจำนวนมหาศาลจากวิดีโอ YouTube รวมถึงวิดีโอของผมด้วย"
ก่อนหน้านี้ นีล โมฮาน ซีอีโอของ YouTube เคยกล่าวว่า บริษัทต่างๆ ที่ใช้ข้อมูลของ YouTube ในการฝึกฝนโมเดล AI นั้นละเมิดข้อกำหนดและเงื่อนไขการให้บริการของแพลตฟอร์ม
ปัจจุบัน บริษัท AI ยังคงไม่เปิดเผยข้อมูลที่ใช้ในการฝึกฝนอัลกอริทึมของตนอย่างโปร่งใส เมื่อต้นเดือนที่ผ่านมา ศิลปินและช่างภาพได้วิพากษ์วิจารณ์ Apple ที่ไม่เปิดเผยแหล่งข้อมูลที่ใช้ในการฝึกฝน Apple Intelligence ซึ่งเป็นฟีเจอร์ AI ใหม่ที่จะใช้งานได้บนอุปกรณ์ Apple หลายล้านเครื่องในปีนี้
YouTube ซึ่งเป็นแพลตฟอร์มโฮสติ้งวิดีโอที่ใหญ่ที่สุด ในโลก ยังเป็น "ขุมทรัพย์" ของข้อมูลสำหรับการฝึกฝน AI เนื่องจากประกอบด้วยการบันทึก เสียง วิดีโอ และรูปภาพ
เมื่อต้นปีที่ผ่านมา มิรา มูราติ ประธานเจ้าหน้าที่ฝ่ายเทคโนโลยีของ OpenAI หลีกเลี่ยงการตอบคำถามจาก The Wall Street Journal เกี่ยวกับว่าบริษัทใช้คลิปวิดีโอจาก YouTube ในการฝึกฝน Sora ซึ่งเป็นเครื่องมือสร้างวิดีโอ AI ที่กำลังจะเปิดตัวของ OpenAI หรือไม่
มูราติกล่าวในขณะนั้นว่า “ผมจะไม่ลงรายละเอียดเกี่ยวกับข้อมูลที่ใช้ แต่เป็นข้อมูลที่ได้รับอนุญาตหรือเป็นข้อมูลที่เปิดเผยต่อสาธารณะ” ขณะเดียวกัน ซุนดาร์ พิชัย ซีอีโอของอัลฟ่า ก็เน้นย้ำว่าบริษัทต่างๆ ที่ใช้ข้อมูลจาก YouTube เพื่อฝึกฝนโมเดล AI นั้นละเมิดข้อกำหนดในการให้บริการของแพลตฟอร์ม
(อ้างอิงจาก Proof News, WSJ)
[โฆษณา_2]
ที่มา: https://vietnamnet.vn/apple-nvidia-va-anthropic-su-dung-trai-phep-du-lieu-youtube-de-dao-tao-ai-2303028.html






การแสดงความคิดเห็น (0)