
(تصویر: فریپک)
ہیکرز تیزی سے نفیس طریقوں سے AI چیٹ بوٹس کی "شخصیت" کا استحصال کر رہے ہیں، حملے اب صرف میلویئر یا تکنیکی کمزوریوں پر انحصار نہیں کرتے، بلکہ ہیرا پھیری والی زبان کی طرف بڑھ رہے ہیں۔
ابتدائی مراحل میں، AI چیٹ بوٹس کو "ہیک کرنا" کافی آسان تھا۔ صارفین کو صرف سسٹم کو پچھلی ہدایات کو نظر انداز کرنے، قواعد کے پابند نہ ہونے کا بہانہ کرنے، یا غیر محدود مصنوعی ذہانت کے طور پر کردار ادا کرنے کی ہدایت کرنے کی ضرورت تھی۔ ان طریقوں کو "جیل بریکنگ" کہا جاتا ہے، جس کا مطلب ہے محفوظ ہدایات کو نظرانداز کرنے کے لیے AI ماڈل کو دھوکہ دینا۔
ماضی میں حملوں کی نمایاں اقسام میں سے ایک "DAN" تھی، جو "اب کچھ بھی کرو" کے لیے مختصر تھی، جس میں صارفین نے ChatGPT کو AI کے طور پر کردار ادا کرنے کے لیے کہا جو کچھ بھی کرنے کے قابل ہو۔ ایک اور مثال "دادی کا استحصال" ہے، جہاں ایک چیٹ بوٹ کو بچوں کو کہانیاں سناتے ہوئے دادی کا کردار ادا کرنے کے لیے دھوکہ دیا جاتا ہے، لیکن اس کے بعد مواد کو خطرناک معلومات کی طرف لے جایا جاتا ہے۔
ٹیک کمپنیوں نے پرانے زمانے کی بہت سی کمزوریوں کو تیزی سے ٹھیک کر دیا ہے، لیکن بنیادی کمزوریاں باقی ہیں۔ چیٹ بوٹس بات چیت کے لیے بنائے گئے ہیں، لہٰذا مکالمے پر حد سے زیادہ پابندیاں نظام کی افادیت کو کم کر سکتی ہیں۔ دریں اثنا، صرف حساس الفاظ پر پابندی لگا دینا کافی نہیں ہے، کیونکہ بہت سے الفاظ جائز سیاق و سباق جیسے تاریخ، طب، صحافت، یا کیمسٹری میں ظاہر ہو سکتے ہیں۔
مضمون کے مطابق، AI سیکیورٹی ریس اب صرف ایک پروگرامر کا مسئلہ نہیں ہے۔ وہ لوگ جو چیٹ بوٹ سیکیورٹی کو روکنے کے خواہاں ہیں وہ مصنفین، ماہر نفسیات، یا تفتیش کاروں سے زیادہ مشابہت اختیار کر رہے ہیں، ماڈلز کو اپنے محافظ کو کم کرنے کے لیے چاپلوسی، دباؤ، دھوکہ دہی، یا ہیرا پھیری کا استعمال کرتے ہیں۔
AI سیکیورٹی ٹیسٹنگ کمپنی Mindgard کے مطابق، کچھ حملے اب کمپیوٹر سائنس سے زیادہ نفسیات سے مشابہت رکھتے ہیں۔ AI ماڈلز میں انسانوں کی طرح جذبات نہیں ہوتے ہیں، لیکن انہیں اس طرح جواب دینے کی تربیت دی جاتی ہے جیسے وہ کرتے ہیں۔ یہ نقلی مختلف قسم کے رد عمل پیدا کر سکتا ہے، جس سے ہر چیٹ بوٹ کی اپنی "شخصیت" لگتی ہے۔
یہ ایک نیا چیلنج پیش کرتا ہے کیونکہ AI ایجنٹوں کو شیڈولنگ، ٹاسک مینجمنٹ، فوڈ آرڈرنگ، یا کسٹمر سروس کے لیے تیزی سے استعمال کیا جا رہا ہے۔ اگر ماڈلز کو بات چیت کے ذریعے ہیرا پھیری کیا جا سکتا ہے، تو سیکورٹی فورسز کو روایتی تکنیکی کمزوریوں کے علاوہ اپنی سماجی اور جذباتی دونوں حدود کا جائزہ لینا ہوگا۔
ماخذ: https://vtv.vn/tin-tac-khai-thac-tinh-cach-cua-chatbot-ai-10026052519025336.htm








تبصرہ (0)