
(صورة: فريبك)
يستغل المتسللون "شخصية" روبوتات الدردشة التي تعمل بالذكاء الاصطناعي بطرق متطورة بشكل متزايد، حيث لم تعد الهجمات تعتمد فقط على البرامج الضارة أو الثغرات التقنية، بل تحولت إلى استخدام لغة تلاعبية.
في المراحل الأولى، كان اختراق روبوتات الدردشة المدعومة بالذكاء الاصطناعي بسيطًا للغاية. كل ما كان على المستخدمين فعله هو توجيه النظام لتجاهل التعليمات السابقة، أو التظاهر بعدم التقيد بالقواعد، أو تقمص دور الذكاء الاصطناعي غير المقيد. تُعرف هذه الأساليب باسم "كسر الحماية"، أي خداع نموذج الذكاء الاصطناعي لتجاوز التعليمات الآمنة.
كان أحد أبرز أنواع الهجمات في الماضي هجوم "DAN"، وهو اختصار لعبارة "افعل أي شيء الآن"، حيث كان المستخدمون يطلبون من برنامج ChatGPT تقمص دور ذكاء اصطناعي قادر على فعل أي شيء. ومن الأمثلة الأخرى "استغلال الجدة"، حيث يتم خداع برنامج دردشة آلي ليلعب دور جدة تروي قصصًا للأطفال، ثم يتم توجيه المحتوى نحو معلومات خطيرة.
سارعت شركات التكنولوجيا إلى معالجة العديد من الثغرات الأمنية القديمة، لكن نقاط الضعف الأساسية لا تزال قائمة. صُممت برامج الدردشة الآلية للتواصل، لذا فإن التقييد المفرط للحوار قد يُقلل من فائدة النظام. في الوقت نفسه، لا يكفي مجرد حظر الكلمات الحساسة، إذ يمكن أن تظهر العديد من الكلمات في سياقات مشروعة مثل التاريخ والطب والصحافة والكيمياء.
بحسب المقال، لم يعد سباق أمن الذكاء الاصطناعي مشكلة تخص المبرمجين فقط. فالذين يسعون للتحايل على أمن برامج الدردشة الآلية باتوا يشبهون الكتّاب وعلماء النفس والمحققين، إذ يستخدمون الإطراء والضغط والخداع والتلاعب لحمل هذه البرامج على التخلي عن حذرها.
بحسب شركة Mindgard المتخصصة في اختبار أمن الذكاء الاصطناعي، باتت بعض الهجمات أقرب إلى علم النفس منها إلى علوم الحاسوب. فنماذج الذكاء الاصطناعي لا تمتلك مشاعر كالبشر، لكنها مُدرَّبة على الاستجابة كما لو كانت كذلك. هذه المحاكاة قادرة على توليد أنواع مختلفة من ردود الفعل، ما يجعل كل روبوت محادثة يبدو وكأنه يمتلك "شخصية" خاصة به.
يُشكّل هذا تحديًا جديدًا مع تزايد استخدام أنظمة الذكاء الاصطناعي في جدولة المواعيد، وإدارة المهام، وطلب الطعام، وخدمة العملاء. وإذا أمكن التلاعب بهذه النماذج من خلال المحادثة، فسيتعين على قوات الأمن دراسة قيودها الاجتماعية والعاطفية، بالإضافة إلى نقاط ضعفها التقنية التقليدية.
المصدر: https://vtv.vn/tin-tac-khai-thac-tinh-cach-cua-chatbot-ai-10026052519025336.htm








تعليق (0)