Hackeři zneužívají „osobnost“ chatbotů s umělou inteligencí.

(Foto: Freepik)

Hackeři zneužívají „osobnost“ chatbotů s umělou inteligencí stále sofistikovanějšími způsoby a útoky se již nespoléhají pouze na malware nebo technické zranitelnosti, ale přesouvají se k manipulativnímu jazyku.

V raných fázích bylo „hackování“ chatbotů s umělou inteligencí celkem jednoduché. Uživatelé stačilo dát systému pokyn, aby ignoroval předchozí instrukce, předstíral, že se neřídí pravidly, nebo se choval jako neomezená umělá inteligence. Tyto metody se nazývají „jailbreaking“, což znamená obelstít model umělé inteligence a obejít bezpečné instrukce.

Jedním z prominentních typů útoků v minulosti byl „DAN“, zkratka pro „Do Anything Now“ (Udělej cokoli hned), kdy uživatelé požádali ChatGPT, aby si zahrál umělou inteligenci schopnou cokoli. Dalším příkladem je „exploit babičky“, kdy je chatbot oklamán, aby hrál roli babičky vyprávějící dětem příběhy, ale obsah je poté směrován k nebezpečným informacím.

Technologické společnosti sice rychle opravily mnoho staromódních zranitelností, ale základní slabiny přetrvávají. Chatboti jsou navrženi pro konverzaci, takže nadměrné omezování dialogu může snížit užitečnost systému. Pouhý zákaz citlivých slov přitom nestačí, protože mnoho slov se může objevit v legitimních kontextech, jako je historie, medicína, žurnalistika nebo chemie.

Podle článku už závod v zabezpečení umělé inteligence není jen problémem programátorů. Ti, kteří se snaží obejít zabezpečení chatbotů, se stále více podobají spisovatelům, psychologům nebo vyšetřovatelům a používají lichotky, nátlak, podvod nebo manipulaci, aby modely zmírnily svou ostražitost.

Podle společnosti Mindgard, která se zabývá testováním bezpečnosti umělé inteligence, se některé útoky nyní více podobají psychologii než informatice . Modely umělé inteligence nemají emoce jako lidé, ale jsou vyškoleny reagovat, jako by je měly. Tato simulace může vytvářet různé typy reakcí, takže každý chatbot vypadá, jako by měl svou vlastní „osobnost“.

To představuje novou výzvu, protože agenti umělé inteligence se stále častěji používají k plánování, správě úkolů, objednávání jídla nebo zákaznickému servisu. Pokud bude možné s modely manipulovat prostřednictvím konverzace, bezpečnostní složky budou muset kromě tradičních technických zranitelností prozkoumat jak svá sociální, tak i emocionální omezení.

Zdroj: https://vtv.vn/tin-tac-khai-thac-tinh-cach-cua-chatbot-ai-10026052519025336.htm