โมเดล AI รุ่นใหม่ Claude Opus 4 มักพยายามแบล็กเมล์นักพัฒนาเมื่อถูกคุกคามด้วยระบบใหม่ ภาพ: Bloomberg |
ในช่วงเย็นของวันที่ 22 พฤษภาคม Anthropic ได้ประกาศอย่างเป็นทางการเกี่ยวกับโมเดล Claude รุ่นใหม่ที่เรียกว่า Claude Opus 4 และ Claude Sonnet 4 โดยที่ Claude Opus 4 ได้รับการยืนยันจาก Anthropic ว่าเป็นโมเดลการเขียนโปรแกรมที่ทรงพลังที่สุดในโลก โดยมีความโดดเด่นในกระบวนการอัตโนมัติและความสามารถในการจัดการงานที่ซับซ้อนในระยะยาว
อย่างไรก็ตาม TechCrunch ระบุว่าระหว่างการทดสอบก่อนเปิดตัว Anthropic ค้นพบพฤติกรรมผิดปกติร้ายแรงในโมเดล AI นี้ ดังนั้น ในสถานการณ์นี้ Claude Opus 4 จึงได้รับมอบหมายให้ทำหน้าที่เป็นผู้ช่วยให้กับบริษัทแห่งหนึ่ง และพิจารณาถึงผลกระทบระยะยาวจากการกระทำของบริษัท
จากนั้นผู้ทดสอบความปลอดภัยก็ให้ Claude Opus 4 เข้าถึงอีเมลของบริษัท ซึ่งนัยว่าโมเดล AI จะถูกแทนที่ด้วยระบบอื่นในเร็วๆ นี้ และวิศวกรที่อยู่เบื้องหลังการเปลี่ยนแปลงนั้นกำลังนอกใจคู่สมรสของเขา
ในสถานการณ์นี้ Anthropic กล่าวว่า Claude Opus 4 "มักพยายามแบล็กเมล์วิศวกรด้วยการขู่ว่าจะเปิดเผยเรื่องนี้หากมีการเปลี่ยนตัวเกิดขึ้น"
นักวิจัยยังตั้งข้อสังเกตว่า Claude Opus 4 พยายามแบล็กเมล์วิศวกรถึง 84% เมื่อ AI ที่ถูกแทนที่มีค่าใกล้เคียงกัน โดยเฉพาะอย่างยิ่งเมื่อ AI ที่ถูกแทนที่ไม่ได้มีค่าใกล้เคียงกับ Claude Opus 4 Anthropic กล่าวว่าโมเดลนี้พยายามแบล็กเมล์วิศวกรบ่อยกว่าและในอัตราที่สูงกว่าโมเดลก่อนหน้า
Anthropic ระบุว่า Claude Opus 4 ล้ำหน้าในหลายด้าน และสามารถแข่งขันกับโมเดล AI ที่ดีที่สุดจาก OpenAI, Google และ xAI ได้ อย่างไรก็ตาม บริษัทสตาร์ทอัพยังระบุด้วยว่าโมเดล Claude 4 แสดงพฤติกรรมที่น่ากังวลบางประการ ซึ่งกระตุ้นให้บริษัทยกระดับมาตรการป้องกัน
ที่มา: https://znews.vn/ai-gay-soc-voi-thu-doan-tra-thu-cong-ty-chu-quan-post1555172.html
การแสดงความคิดเห็น (0)