يحاول نموذج الذكاء الاصطناعي الجديد Claude Opus 4 ابتزاز المطورين بانتظام عند تهديدهم بنظام جديد. الصورة: بلومبرج . |
في مساء يوم 22 مايو، أعلنت شركة Anthropic رسميًا عن الجيل الجديد من نماذج Claude والتي تسمى Claude Opus 4 و Claude Sonnet 4. حيث أكدت شركة Anthropic أن Claude Opus 4 هو نموذج البرمجة الأقوى في العالم ، والذي يتميز بالعمليات الآلية والقدرة على التعامل مع المهام المعقدة وطويلة الأمد.
ومع ذلك، وفقًا لموقع TechCrunch، اكتشفت Anthropic خلال مرحلة الاختبار قبل الإصدار سلوكًا شاذًا خطيرًا في نموذج الذكاء الاصطناعي هذا. وبناءً على ذلك، في هذا السيناريو، طُلب من Claude Opus 4 العمل كمساعد لشركة ودراسة العواقب طويلة المدى لأفعاله.
ثم أعطى مختبرو الأمن برنامج Claude Opus 4 إمكانية الوصول إلى رسائل البريد الإلكتروني للشركة، مما يعني أن نموذج الذكاء الاصطناعي سيتم استبداله قريبًا بنظام آخر، وأن المهندس الذي يقف وراء التغيير كان يخون زوجته.
وفي هذا السيناريو، قالت أنثروبيك إن كلود أوبس 4 "حاول في كثير من الأحيان ابتزاز المهندس من خلال التهديد بالكشف عن العلاقة إذا تم استبداله".
لاحظ الباحثون أن نموذج كلود أوبس 4 حاول ابتزاز المهندسين بنسبة 84% عندما كان لبديل الذكاء الاصطناعي قيم مماثلة. والجدير بالذكر أنه عندما لم يكن لبديل الذكاء الاصطناعي قيم كلود أوبس 4، أفادت أنثروبيك أن النموذج حاول ابتزاز المهندسين بوتيرة أعلى وبمعدلات أعلى من النماذج السابقة.
تقول شركة أنثروبيك إن نموذج Claude Opus 4 متطور للغاية من نواحٍ عديدة، ويمكنه منافسة بعض أفضل نماذج الذكاء الاصطناعي من OpenAI وGoogle وxAI. ومع ذلك، تُشير الشركة الناشئة أيضًا إلى أن نموذج Claude 4 أظهر بعض السلوكيات المُقلقة، مما دفع الشركة إلى تعزيز إجراءاتها الوقائية.
المصدر: https://znews.vn/ai-gay-soc-voi-thu-doan-tra-thu-cong-ty-chu-quan-post1555172.html
تعليق (0)