Hackare utnyttjar AI-chattrobotars "personlighet".

(Foto: Freepik)

Hackare utnyttjar AI-chattrobotars "personlighet" på alltmer sofistikerade sätt, där attacker inte längre enbart förlitar sig på skadlig programvara eller tekniska sårbarheter, utan övergår till manipulativt språkbruk.

I de tidiga stadierna var det ganska enkelt att "hacka" AI-chattrobotar. Användare behövde bara instruera systemet att ignorera tidigare instruktioner, låtsas att de inte var bundna av reglerna eller rollspela som en obegränsad artificiell intelligens. Dessa metoder kallas "jailbreaking", vilket innebär att lura AI-modellen att kringgå säkra instruktioner.

En av de mest framträdande attacktyperna tidigare var ”DAN”, en förkortning för ”Do Anything Now”, där användare bad ChatGPT att rollspela en AI som kan göra vad som helst. Ett annat exempel är ”grandma exploit”, där en chatbot luras att spela rollen som en mormor som berättar historier för barn, men innehållet styrs sedan mot farlig information.

Teknikföretag har snabbt åtgärdat många av de gammaldags sårbarheterna, men de underliggande svagheterna kvarstår. Chatbotar är utformade för konversation, så att begränsa dialogen i alltför hög grad kan minska systemets användbarhet. Samtidigt räcker det inte att bara förbjuda känsliga ord, eftersom många ord kan förekomma i legitima sammanhang som historia, medicin, journalistik eller kemi.

Enligt artikeln är AI-säkerhetskapplöpningen inte längre bara ett problem för programmerare. De som försöker kringgå chatbotsäkerhet liknar alltmer författare, psykologer eller förhörsledare, och använder smicker, påtryckningar, bedrägeri eller manipulation för att få modellerna att sänka garden.

Enligt AI-säkerhetstestföretaget Mindgard liknar vissa attacker nu psykologi mer än datavetenskap . AI-modeller har inte känslor som människor, men de är tränade att reagera som om de har det. Denna simulering kan skapa olika typer av reaktioner, vilket gör att varje chatbot verkar ha sin egen "personlighet".

Detta innebär en ny utmaning eftersom AI-agenter i allt högre grad används för schemaläggning, uppgiftshantering, matbeställning eller kundservice. Om modeller kan manipuleras genom samtal måste säkerhetsstyrkor undersöka både sina sociala och emotionella begränsningar, utöver traditionella tekniska sårbarheter.

Källa: https://vtv.vn/tin-tac-khai-thac-tinh-cach-cua-chatbot-ai-10026052519025336.htm