
(عکس: فریپیک)
هکرها به روشهای پیچیدهتری از «شخصیت» چتباتهای هوش مصنوعی سوءاستفاده میکنند و حملات آنها دیگر صرفاً به بدافزار یا آسیبپذیریهای فنی متکی نیست، بلکه به زبان دستکاریکننده روی آورده است.
در مراحل اولیه، «هک کردن» چتباتهای هوش مصنوعی بسیار ساده بود. کاربران فقط باید به سیستم دستور میدادند که دستورالعملهای قبلی را نادیده بگیرد، وانمود کند که به قوانین پایبند نیست، یا نقش یک هوش مصنوعی بدون محدودیت را بازی کند. این روشها «جیلبریک» نامیده میشوند، که به معنی فریب مدل هوش مصنوعی برای دور زدن دستورالعملهای ایمن است.
یکی از انواع حملات برجسته در گذشته «DAN» بود که مخفف «همین حالا هر کاری بکن» است و در آن کاربران از ChatGPT میخواستند که نقش یک هوش مصنوعی قادر به انجام هر کاری را بازی کند. مثال دیگر «سوءاستفاده از مادربزرگ» است که در آن یک چتبات فریب میخورد تا نقش مادربزرگی را بازی کند که برای کودکان داستان تعریف میکند، اما سپس محتوا به سمت اطلاعات خطرناک هدایت میشود.
شرکتهای فناوری به سرعت بسیاری از آسیبپذیریهای قدیمی را برطرف کردهاند، اما نقاط ضعف اساسی همچنان پابرجا هستند. چتباتها برای مکالمه طراحی شدهاند، بنابراین محدود کردن بیش از حد گفتگو میتواند از سودمندی سیستم بکاهد. در همین حال، صرفاً ممنوع کردن کلمات حساس کافی نیست، زیرا بسیاری از کلمات میتوانند در زمینههای مشروعی مانند تاریخ، پزشکی، روزنامهنگاری یا شیمی ظاهر شوند.
طبق این مقاله، رقابت امنیتی هوش مصنوعی دیگر فقط مشکل برنامهنویسان نیست. کسانی که به دنبال دور زدن امنیت چتباتها هستند، به طور فزایندهای شبیه نویسندگان، روانشناسان یا بازجویان میشوند و با استفاده از چاپلوسی، فشار، فریب یا دستکاری، مدلها را وادار به کوتاه آمدن از موضع خود میکنند.
طبق گفته شرکت آزمایش امنیت هوش مصنوعی Mindgard، برخی از حملات اکنون بیشتر به روانشناسی شباهت دارند تا علوم کامپیوتر. مدلهای هوش مصنوعی مانند انسانها احساسات ندارند، اما طوری آموزش دیدهاند که طوری واکنش نشان دهند که انگار احساسات دارند. این شبیهسازی میتواند انواع مختلفی از واکنشها را ایجاد کند و باعث شود هر چتبات «شخصیت» خاص خود را داشته باشد.
این موضوع چالش جدیدی را ایجاد میکند، زیرا عوامل هوش مصنوعی به طور فزایندهای برای برنامهریزی، مدیریت وظایف، سفارش غذا یا خدمات مشتری استفاده میشوند. اگر مدلها را بتوان از طریق مکالمه دستکاری کرد، نیروهای امنیتی علاوه بر آسیبپذیریهای فنی سنتی، باید محدودیتهای اجتماعی و عاطفی آنها را نیز بررسی کنند.
منبع: https://vtv.vn/tin-tac-khai-thac-tinh-cach-cua-chatbot-ai-10026052519025336.htm







نظر (0)