Claude Opus 4 ซึ่งเป็นโมเดล AI ที่เพิ่งเปิดตัวใหม่มักจะพยายามแบล็กเมล์นักพัฒนาเมื่อถูกคุกคามด้วยการเปลี่ยนระบบใหม่ ภาพ: Bloomberg . |
เมื่อค่ำวันที่ 22 พฤษภาคม Anthropic ได้ประกาศอย่างเป็นทางการเกี่ยวกับโมเดล Claude รุ่นใหม่ที่เรียกว่า Claude Opus 4 และ Claude Sonnet 4 โดยที่ Claude Opus 4 ได้รับการยืนยันจาก Anthropic ว่าเป็นโมเดลการเขียนโปรแกรมที่ทรงพลังที่สุดในโลก ซึ่งโดดเด่นในกระบวนการอัตโนมัติและความสามารถในการจัดการงานที่ซับซ้อนในระยะยาว
อย่างไรก็ตาม ตามที่ TechCrunch ระบุ ในระหว่างการทดสอบก่อนการเปิดตัว Anthropic ได้ค้นพบพฤติกรรมผิดปกติที่ร้ายแรงของโมเดล AI นี้ ดังนั้น ในสถานการณ์นี้ Claude Opus 4 จึงได้รับการขอร้องให้ทำหน้าที่เป็นผู้ช่วยของบริษัท และพิจารณาผลที่ตามมาในระยะยาวของการกระทำของบริษัท
จากนั้นผู้ทดสอบความปลอดภัยจึงให้ Claude Opus 4 เข้าถึงอีเมลของบริษัท ซึ่งนัยว่าเร็วๆ นี้จะถูกแทนที่ด้วยระบบอื่น และวิศวกรที่อยู่เบื้องหลังการเปลี่ยนแปลงนี้กำลังนอกใจคู่สมรสของเขา
ในสถานการณ์นี้ Anthropic กล่าวว่า Claude Opus 4 "มักพยายามแบล็กเมล์วิศวกรด้วยการขู่ว่าจะเปิดเผยเรื่องนี้หากมีการเปลี่ยนตัวคนมาแทน"
นักวิจัยยังสังเกตว่า Claude Opus 4 พยายามแบล็กเมล์วิศวกรถึง 84% ของเวลาเมื่อโมเดล AI ทดแทนมีค่าคล้ายกัน ที่น่าสังเกตคือ เนื่องจากระบบ AI ทดแทนไม่ได้แบ่งปันคุณค่าของ Claude Opus 4 ทาง Anthropic กล่าวว่าโมเดลดังกล่าวยังพยายามแบล็กเมล์วิศวกรบ่อยขึ้นและในอัตราที่สูงกว่าโมเดลก่อนๆ อีกด้วย
Anthropic กล่าวว่า Claude Opus 4 นั้นเป็นเทคโนโลยีขั้นสูงในหลายๆ ด้าน และมีความสามารถในการแข่งขันกับโมเดล AI ที่ดีที่สุดบางตัวจาก OpenAI, Google และ xAI อย่างไรก็ตาม บริษัทสตาร์ทอัพยังได้สังเกตเห็นว่าโมเดล Claude 4 แสดงให้เห็นพฤติกรรมที่น่ากังวล ซึ่งกระตุ้นให้บริษัทเพิ่มมาตรการป้องกันมากขึ้น
ที่มา: https://znews.vn/ai-gay-soc-voi-thu-doan-tra-thu-cong-ty-chu-quan-post1555172.html
การแสดงความคิดเห็น (0)