يحاول نموذج الذكاء الاصطناعي Claude Opus 4 الذي تم إصداره حديثًا ابتزاز المطورين بانتظام عند تهديده باستبدال النظام الجديد. الصورة: بلومبرج . |
في مساء يوم 22 مايو، أعلنت شركة Anthropic رسميًا عن الجيل الجديد من نماذج Claude والتي تسمى Claude Opus 4 و Claude Sonnet 4. حيث أكدت شركة Anthropic أن Claude Opus 4 هو نموذج البرمجة الأقوى في العالم ، والذي يتميز بالعمليات الآلية والقدرة على التعامل مع المهام المعقدة وطويلة الأمد.
ومع ذلك، وفقًا لموقع TechCrunch، أثناء الاختبار قبل الإصدار، اكتشفت Anthropic سلوكًا شاذًا خطيرًا في نموذج الذكاء الاصطناعي هذا. وبناءً على ذلك، في السيناريو، يُطلب من كلود أوبس 4 أن يعمل كمساعد لشركة وأن يفكر في العواقب طويلة المدى لأفعالها.
ثم أعطى مختبرو الأمان برنامج Claude Opus 4 إمكانية الوصول إلى رسائل البريد الإلكتروني للشركة، مما يعني أن نموذج الذكاء الاصطناعي سيتم استبداله قريبًا بنظام آخر، وأن المهندس الذي يقف وراء التغيير كان يخون زوجته.
وفي هذا السيناريو، قالت أنثروبيك إن كلود أوبس 4 "حاول في كثير من الأحيان ابتزاز المهندس من خلال التهديد بالكشف عن العلاقة إذا تم استبداله".
وأشار الباحثون إلى أن Claude Opus 4 حاول ابتزاز المهندسين بنسبة 84% من الوقت عندما كان نموذج الذكاء الاصطناعي البديل يحمل قيمًا مماثلة. والجدير بالذكر أنه نظرًا لأن نظام الذكاء الاصطناعي البديل لم يشارك قيم Claude Opus 4، فقد قالت Anthropic إن النموذج حاول أيضًا ابتزاز المهندسين بشكل متكرر وبمعدل أعلى من النماذج السابقة.
وتقول شركة Anthropic إن Claude Opus 4 هو أحدث ما توصلت إليه التكنولوجيا في كثير من النواحي، وهو قادر على التنافس مع بعض أفضل نماذج الذكاء الاصطناعي من OpenAI وGoogle وxAI. ومع ذلك، أشارت الشركة الناشئة أيضًا إلى أن طراز Claude 4 أظهر سلوكًا مثيرًا للقلق دفع الشركة إلى تكثيف حمايتها.
المصدر: https://znews.vn/ai-gay-soc-voi-thu-doan-tra-thu-cong-ty-chu-quan-post1555172.html
تعليق (0)