เมื่อเร็วๆ นี้ Baidu Baike ซึ่งเป็นเว็บไซต์ที่เทียบเท่ากับ Wikipedia ของจีน ได้อัปเดตไฟล์ robots.txt ซึ่งเป็นไฟล์ที่สั่งให้เครื่องมือค้นหาทราบว่าสามารถเข้าถึงที่อยู่เว็บใดได้บ้าง และบล็อก Googlebot และ Bingbot ไม่ให้สร้างดัชนีเนื้อหาจากแพลตฟอร์มได้อย่างสมบูรณ์
ภาพ: Shutterstock
การเคลื่อนไหวดังกล่าวแสดงให้เห็นว่า Baidu กำลังพยายามปกป้องสินทรัพย์ออนไลน์ท่ามกลางความต้องการที่เพิ่มขึ้นสำหรับข้อมูลขนาดใหญ่เพื่อพัฒนาโมเดลและแอปพลิเคชันปัญญาประดิษฐ์ (AI)
หลังจากการอัปเดต robots.txt ของ Baidu Baike การตรวจสอบของ SCMP พบว่ารายการจำนวนมากจากแพลตฟอร์มดังกล่าวยังคงปรากฏในผลการค้นหาของ Google และ Bing ซึ่งอาจมาจากเนื้อหาเก่าที่เก็บถาวรไว้ก่อนหน้านี้
มากกว่าสองปีหลังจากที่ OpenAI เปิดตัว ChatGPT นักพัฒนา AI รายใหญ่ ของโลก หลายรายก็ได้ลงนามข้อตกลงกับผู้เผยแพร่เนื้อหาเพื่อเข้าถึงเนื้อหาคุณภาพสำหรับโครงการ GenAI ของพวกเขา
OpenAI ได้ลงนามข้อตกลงกับนิตยสาร Time ในเดือนมิถุนายน เพื่อเข้าถึงคลังข้อมูลประวัติศาสตร์กว่า 100 ปีของนิตยสารทั้งหมด
กาวฟอง (ตาม SCMP)
ที่มา: https://www.congluan.vn/baidu-chan-google-va-bing-thu-thap-noi-dung-truc-tuyen-post309081.html
การแสดงความคิดเห็น (0)