การสืบสวนโดย Proof News พบว่าบริษัทเหล่านี้ใช้ชุดข้อมูลที่สร้างขึ้นโดยองค์กรไม่แสวงหากำไรที่เรียกว่า EleutherAI ซึ่งประกอบด้วยการบันทึกเนื้อหา วิดีโอ YouTube จากช่องต่างๆ มากกว่า 48,000 ช่องโดยไม่ได้ขออนุญาตจากเจ้าของเนื้อหาหรือผู้สร้าง
แม้ว่าชุดข้อมูลจะไม่มีรูปภาพหรือวิดีโอ แต่ก็มีเนื้อหาจากผู้สร้างเนื้อหาชั้นนำบนแพลตฟอร์ม เช่น Marques Brownlee และ MrBeast รวมถึงผู้จัดพิมพ์ข่าวรายใหญ่ เช่น The New York Times, BBC และ ABC News นอกจากนี้ยังมีคำบรรยายจากวิดีโอที่เป็นของ Engadget อีกด้วย
Brownlee YouTuber ชื่อดังโพสต์บน X ว่า "Apple ได้รับข้อมูลสำหรับ AI ของตนจากบริษัทหลายแห่ง หนึ่งในนั้นคือข้อมูล/การบันทึกจำนวนมหาศาลจากวิดีโอ YouTube รวมถึงวิดีโอของฉันด้วย"
ก่อนหน้านี้ นีล โมฮาน ซีอีโอของ YouTube ยืนยันว่าบริษัทต่างๆ ที่ใช้ข้อมูลของ YouTube เพื่อฝึกโมเดล AI ถือเป็นการละเมิดข้อกำหนดและเงื่อนไขในการให้บริการของแพลตฟอร์ม
บริษัทด้าน AI ยังไม่มีความโปร่งใสเกี่ยวกับข้อมูลที่ใช้ในการฝึกอัลกอริทึม เมื่อต้นเดือนนี้ ศิลปินและช่างภาพได้วิพากษ์วิจารณ์ Apple ที่ไม่เปิดเผยข้อมูลการฝึกสำหรับ Apple Intelligence ซึ่งเป็นฟีเจอร์ใหม่ของ AI ที่จะพร้อมใช้งานในอุปกรณ์ Apple หลายล้านเครื่องในปีนี้
YouTube ซึ่งเป็นแหล่งเก็บวิดีโอที่ใหญ่ที่สุดในโลก ยังเป็นแหล่งข้อมูลอันล้ำค่าสำหรับการฝึกอบรม AI ไม่ว่าจะเป็นคำบรรยาย เสียง วิดีโอ และรูปภาพ
เมื่อต้นปีนี้ มิรา มูราติ หัวหน้าฝ่ายเทคโนโลยีของ OpenAI หลบเลี่ยงคำถามจาก The Wall Street Journal เกี่ยวกับการที่บริษัทใช้วิดีโอ YouTube เพื่อฝึก Sora ซึ่งเป็นเครื่องมือสร้างวิดีโอ AI ที่กำลังจะออกใหม่ของ OpenAI หรือไม่
Murati กล่าวในตอนนั้นว่า “ผมจะไม่ลงรายละเอียดเกี่ยวกับข้อมูลที่ใช้ แต่เป็นข้อมูลที่ได้รับอนุญาตหรือเปิดเผยต่อสาธารณะ” ในขณะเดียวกัน Sundar Pichai ซีอีโอของ Alphabet ยังเน้นย้ำด้วยว่าบริษัทที่ใช้ข้อมูลจาก YouTube เพื่อฝึกโมเดล AI ถือเป็นการละเมิดข้อกำหนดในการให้บริการของแพลตฟอร์ม
(อ้างอิงจาก Proof News, WSJ)
ที่มา: https://vietnamnet.vn/apple-nvidia-va-anthropic-su-dung-trai-phep-du-lieu-youtube-de-dao-tao-ai-2303028.html
การแสดงความคิดเห็น (0)