هکرها از «شخصیت» چت‌بات‌های هوش مصنوعی سوءاستفاده می‌کنند.

(عکس: فری‌پیک)

هکرها به روش‌های پیچیده‌تری از «شخصیت» چت‌بات‌های هوش مصنوعی سوءاستفاده می‌کنند و حملات آنها دیگر صرفاً به بدافزار یا آسیب‌پذیری‌های فنی متکی نیست، بلکه به زبان دستکاری‌کننده روی آورده است.

در مراحل اولیه، «هک کردن» چت‌بات‌های هوش مصنوعی بسیار ساده بود. کاربران فقط باید به سیستم دستور می‌دادند که دستورالعمل‌های قبلی را نادیده بگیرد، وانمود کند که به قوانین پایبند نیست، یا نقش یک هوش مصنوعی بدون محدودیت را بازی کند. این روش‌ها «جیل‌بریک» نامیده می‌شوند، که به معنی فریب مدل هوش مصنوعی برای دور زدن دستورالعمل‌های ایمن است.

یکی از انواع حملات برجسته در گذشته «DAN» بود که مخفف «همین حالا هر کاری بکن» است و در آن کاربران از ChatGPT می‌خواستند که نقش یک هوش مصنوعی قادر به انجام هر کاری را بازی کند. مثال دیگر «سوءاستفاده از مادربزرگ» است که در آن یک چت‌بات فریب می‌خورد تا نقش مادربزرگی را بازی کند که برای کودکان داستان تعریف می‌کند، اما سپس محتوا به سمت اطلاعات خطرناک هدایت می‌شود.

شرکت‌های فناوری به سرعت بسیاری از آسیب‌پذیری‌های قدیمی را برطرف کرده‌اند، اما نقاط ضعف اساسی همچنان پابرجا هستند. چت‌بات‌ها برای مکالمه طراحی شده‌اند، بنابراین محدود کردن بیش از حد گفتگو می‌تواند از سودمندی سیستم بکاهد. در همین حال، صرفاً ممنوع کردن کلمات حساس کافی نیست، زیرا بسیاری از کلمات می‌توانند در زمینه‌های مشروعی مانند تاریخ، پزشکی، روزنامه‌نگاری یا شیمی ظاهر شوند.

طبق این مقاله، رقابت امنیتی هوش مصنوعی دیگر فقط مشکل برنامه‌نویسان نیست. کسانی که به دنبال دور زدن امنیت چت‌بات‌ها هستند، به طور فزاینده‌ای شبیه نویسندگان، روانشناسان یا بازجویان می‌شوند و با استفاده از چاپلوسی، فشار، فریب یا دستکاری، مدل‌ها را وادار به کوتاه آمدن از موضع خود می‌کنند.

طبق گفته شرکت آزمایش امنیت هوش مصنوعی Mindgard، برخی از حملات اکنون بیشتر به روانشناسی شباهت دارند تا علوم کامپیوتر. مدل‌های هوش مصنوعی مانند انسان‌ها احساسات ندارند، اما طوری آموزش دیده‌اند که طوری واکنش نشان دهند که انگار احساسات دارند. این شبیه‌سازی می‌تواند انواع مختلفی از واکنش‌ها را ایجاد کند و باعث شود هر چت‌بات «شخصیت» خاص خود را داشته باشد.

این موضوع چالش جدیدی را ایجاد می‌کند، زیرا عوامل هوش مصنوعی به طور فزاینده‌ای برای برنامه‌ریزی، مدیریت وظایف، سفارش غذا یا خدمات مشتری استفاده می‌شوند. اگر مدل‌ها را بتوان از طریق مکالمه دستکاری کرد، نیروهای امنیتی علاوه بر آسیب‌پذیری‌های فنی سنتی، باید محدودیت‌های اجتماعی و عاطفی آنها را نیز بررسی کنند.

منبع: https://vtv.vn/tin-tac-khai-thac-tinh-cach-cua-chatbot-ai-10026052519025336.htm