การสืบสวนโดย Proof News พบว่าบริษัทเหล่านี้ใช้ชุดข้อมูลที่สร้างขึ้นโดยบริษัทไม่แสวงหากำไรที่ชื่อว่า EleutherAI ซึ่งประกอบด้วยการบันทึกเนื้อหา วิดีโอ YouTube จากช่องมากกว่า 48,000 ช่องโดยไม่ได้ขออนุญาตจากเจ้าของหรือผู้สร้างเนื้อหา
แม้ว่าชุดข้อมูลนี้จะไม่มีรูปภาพหรือวิดีโอ แต่ก็มีเนื้อหาจากผู้สร้างเนื้อหาชั้นนำบนแพลตฟอร์ม เช่น Marques Brownlee และ MrBeast รวมถึงผู้เผยแพร่ข่าวรายใหญ่อย่าง The New York Times, BBC และ ABC News นอกจากนี้ยังมีคำบรรยายจากวิดีโอของ Engadget อีกด้วย
Brownlee ยูทูบเบอร์ชื่อดังโพสต์บน X ว่า "Apple ได้รับข้อมูลสำหรับ AI มาจากบริษัทหลายแห่ง หนึ่งในนั้นคือข้อมูล/การบันทึกจำนวนมหาศาลจากวิดีโอใน YouTube รวมถึงวิดีโอของฉันด้วย"
ก่อนหน้านี้ นีล โมฮาน ซีอีโอของ YouTube ยืนยันว่าการที่บริษัทต่างๆ ที่ใช้ข้อมูลของ YouTube เพื่อฝึกอบรมโมเดล AI ถือเป็นการละเมิดข้อกำหนดและบริการของแพลตฟอร์ม
บริษัท AI ยังไม่มีความโปร่งใสเกี่ยวกับข้อมูลที่ใช้ในการฝึกฝนอัลกอริทึม เมื่อต้นเดือนที่ผ่านมา ศิลปินและช่างภาพได้ออกมาวิพากษ์วิจารณ์ Apple ที่ไม่เปิดเผยข้อมูลการฝึกฝนสำหรับ Apple Intelligence ซึ่งเป็นฟีเจอร์ AI ใหม่ที่จะพร้อมใช้งานบนอุปกรณ์ Apple หลายล้านเครื่องในปีนี้
YouTube ซึ่งเป็นแหล่งเก็บวิดีโอที่ใหญ่ที่สุด ในโลก ยังเป็นแหล่งข้อมูลอันล้ำค่าสำหรับการฝึกอบรม AI รวมถึงบทบรรยาย เสียง วิดีโอ และรูปภาพ
เมื่อต้นปีนี้ Mira Murati หัวหน้าฝ่ายเทคโนโลยีของ OpenAI หลบเลี่ยงคำถามจาก The Wall Street Journal เกี่ยวกับการที่บริษัทใช้วิดีโอ YouTube เพื่อฝึก Sora ซึ่งเป็นเครื่องมือสร้างวิดีโอ AI รุ่นใหม่ของ OpenAI หรือไม่
“ผมจะไม่ลงรายละเอียดเกี่ยวกับข้อมูลที่นำมาใช้ แต่เป็นข้อมูลที่ได้รับอนุญาตหรือเปิดเผยต่อสาธารณะ” มูราติกล่าวในขณะนั้น ขณะเดียวกัน ซันดาร์ พิชัย ซีอีโอของ Alphabet ยังเน้นย้ำว่าบริษัทต่างๆ ที่ใช้ข้อมูลจาก YouTube เพื่อฝึกฝนโมเดล AI ถือเป็นการละเมิดข้อกำหนดในการให้บริการของแพลตฟอร์ม
(อ้างอิงจาก Proof News, WSJ)
ที่มา: https://vietnamnet.vn/apple-nvidia-va-anthropic-su-dung-trai-phep-du-lieu-youtube-de-dao-tao-ai-2303028.html
การแสดงความคิดเห็น (0)