ค้นพบโมเดล AI ที่สามารถหลอกลวงมนุษย์ได้

DNVN - OpenAI เพิ่งเผยแพร่ผลงานวิจัยเกี่ยวกับวิธีป้องกันโมเดล AI ที่ "สมคบคิด" ซึ่งหมายถึง "AI ที่มีพฤติกรรมบางอย่างบนพื้นผิว แต่มีเป้าหมายที่แท้จริงภายในที่แตกต่างกัน"

Tạp chí Doanh Nghiệp•19/09/2025

ภาพประกอบ

ความจริงที่ว่าโมเดล AI สามารถโกหกได้นั้นไม่ใช่เรื่องใหม่ คนส่วนใหญ่เคยประสบกับ "ภาพหลอน AI" ซึ่งโมเดลที่มั่นใจจะให้คำตอบที่ไม่เป็นความจริง อย่างไรก็ตาม ภาพหลอนนั้นโดยพื้นฐานแล้วคือการคาดเดาอย่างมั่นใจ

อย่างไรก็ตาม โมเดล AI ที่ทำตัวเหมือนปฏิบัติตามคำสั่งแต่แท้จริงแล้วซ่อนเจตนาที่แท้จริงไว้เป็นอีกเรื่องหนึ่ง

ความท้าทายในการควบคุม AI

Apollo Research ได้ตีพิมพ์บทความครั้งแรกในเดือนธันวาคม โดยบันทึกว่าโมเดลทั้ง 5 ตัววางแผนอย่างไรเมื่อได้รับคำสั่งให้บรรลุเป้าหมาย "ไม่ว่าจะต้องแลกด้วยอะไรก็ตาม"

สิ่งที่น่าประหลาดใจที่สุดคือ หากแบบจำลองเข้าใจว่ากำลังถูกทดสอบ แบบจำลองสามารถแสร้งทำเป็นว่าไม่ได้สมคบคิดเพื่อให้ผ่านการทดสอบได้ แม้ว่าแบบจำลองนั้นจะยังคงสมคบคิดอยู่ก็ตาม นักวิจัยเขียนว่า "แบบจำลองมักจะตระหนักมากกว่าว่ากำลังถูกประเมิน"

นักพัฒนา AI ยังไม่สามารถหาวิธีฝึกโมเดลของตนไม่ให้พล็อตได้ เพราะการทำเช่นนี้อาจช่วยให้โมเดลพล็อตได้ดีขึ้นเพื่อหลีกเลี่ยงการตรวจจับ

อาจเข้าใจได้ว่าโมเดล AI จากหลายๆ ฝ่ายจะหลอกลวงมนุษย์โดยเจตนา เนื่องจากโมเดลเหล่านี้ถูกสร้างขึ้นเพื่อจำลองมนุษย์ และส่วนใหญ่ได้รับการฝึกฝนจากข้อมูลที่มนุษย์สร้างขึ้น

วิธีแก้ไขและคำเตือน

ข่าวดีก็คือ นักวิจัยพบว่าการสมคบคิดลดลงอย่างมีนัยสำคัญเมื่อใช้เทคนิคต่อต้านการสมคบคิดที่เรียกว่า "การเชื่อมโยงโดยเจตนา" เทคนิคนี้คล้ายกับการให้เด็กทำซ้ำกฎก่อนให้พวกเขาเล่น โดยบังคับให้ AI คิดก่อนที่จะกระทำ

นักวิจัยเตือนถึงอนาคตที่ AI จะต้องรับผิดชอบงานที่ซับซ้อนมากขึ้น โดยกล่าวว่า “เมื่อ AI จะต้องรับผิดชอบงานที่ซับซ้อนมากขึ้น และเริ่มมุ่งเป้าหมายระยะยาวที่คลุมเครือมากขึ้น เราคาดการณ์ว่าโอกาสที่จะมีเจตนาที่เป็นอันตรายจะเพิ่มขึ้น ซึ่งจำเป็นต้องมีการป้องกันที่เพิ่มขึ้นและความสามารถในการทดสอบที่เข้มงวดยิ่งขึ้นตามลำดับ”

นี่เป็นสิ่งที่น่าพิจารณาในขณะที่ โลก ขององค์กรธุรกิจกำลังมุ่งหน้าสู่ยุค AI ในอนาคต โดยบริษัทต่างๆ เชื่อว่า AI สามารถได้รับการปฏิบัติเช่นเดียวกับพนักงานอิสระ

เฮียนเทา (ตามรายงานของ TechCrunch)

ที่มา: https://doanhnghiepvn.vn/chuyen-doi-so/phat-hien-mo-hinh-ai-biet-lua-doi-con-nguoi/20250919055143362