Peretas mengeksploitasi "kepribadian" chatbot AI.

(Foto: Freepik)

Peretas mengeksploitasi "kepribadian" chatbot AI dengan cara yang semakin canggih, di mana serangan tidak lagi hanya bergantung pada malware atau kerentanan teknis, tetapi beralih ke bahasa yang manipulatif.

Pada tahap awal, "meretas" chatbot AI cukup sederhana. Pengguna hanya perlu menginstruksikan sistem untuk mengabaikan instruksi sebelumnya, berpura-pura tidak terikat oleh aturan, atau berperan sebagai kecerdasan buatan yang tidak terkekang. Metode ini disebut "jailbreaking," yang berarti mengelabui model AI untuk melewati instruksi yang aman.

Salah satu jenis serangan yang menonjol di masa lalu adalah "DAN," singkatan dari "Do Anything Now," di mana pengguna meminta ChatGPT untuk berperan sebagai AI yang mampu melakukan apa saja. Contoh lain adalah "eksploitasi nenek," di mana chatbot ditipu untuk berperan sebagai nenek yang bercerita kepada anak-anak, tetapi kontennya kemudian diarahkan ke informasi berbahaya.

Perusahaan teknologi telah dengan cepat menambal banyak kerentanan kuno, tetapi kelemahan mendasar tetap ada. Chatbot dirancang untuk percakapan, jadi pembatasan dialog yang berlebihan dapat mengurangi kegunaan sistem. Sementara itu, melarang kata-kata sensitif saja tidak cukup, karena banyak kata dapat muncul dalam konteks yang sah seperti sejarah, kedokteran, jurnalisme, atau kimia.

Menurut artikel tersebut, perlombaan keamanan AI bukan lagi hanya masalah programmer. Mereka yang berupaya mengakali keamanan chatbot semakin menyerupai penulis, psikolog, atau interogator, menggunakan sanjungan, tekanan, penipuan, atau manipulasi untuk membuat model-model tersebut lengah.

Menurut perusahaan pengujian keamanan AI Mindgard, beberapa serangan sekarang lebih menyerupai psikologi daripada ilmu komputer. Model AI tidak memiliki emosi seperti manusia, tetapi mereka dilatih untuk merespons seolah-olah mereka memilikinya. Simulasi ini dapat menciptakan berbagai jenis reaksi, membuat setiap chatbot tampak memiliki "kepribadian" sendiri.

Hal ini menghadirkan tantangan baru karena agen AI semakin banyak digunakan untuk penjadwalan, manajemen tugas, pemesanan makanan, atau layanan pelanggan. Jika model dapat dimanipulasi melalui percakapan, pasukan keamanan harus memeriksa keterbatasan sosial dan emosionalnya, di samping kerentanan teknis tradisional.

Sumber: https://vtv.vn/tin-tac-khai-thac-tinh-cach-cua-chatbot-ai-10026052519025336.htm