A hackerek kihasználják a mesterséges intelligencia alapú chatbotok „személyiségét”.

(Fotó: Freepik)

A hackerek egyre kifinomultabb módon használják ki a mesterséges intelligencia alapú chatbotok „személyiségét”, a támadások már nem kizárólag rosszindulatú programokra vagy technikai sebezhetőségekre támaszkodnak, hanem a manipulatív nyelvezet felé fordulnak.

A korai szakaszban a mesterséges intelligencia alapú chatbotok „feltörése” meglehetősen egyszerű volt. A felhasználóknak csak arra kellett utasítaniuk a rendszert, hogy hagyja figyelmen kívül a korábbi utasításokat, tegyenek úgy, mintha nem kötnék őket a szabályok, vagy egy korlátlan mesterséges intelligencia szerepét játsszák el. Ezeket a módszereket „jailbreakelésnek” nevezik, ami azt jelenti, hogy a mesterséges intelligencia modelljét úgy trükközik, hogy megkerülje a biztonságos utasításokat.

A múlt egyik legjelentősebb támadástípusa a „DAN” volt, ami a „Do Anything Now” (Do Anything Now) rövidítése, és amelyben a felhasználók arra kérték a ChatGPT-t, hogy játsszon el egy bármire képes mesterséges intelligenciát. Egy másik példa a „grandma exploit”, ahol egy chatbotot becsapnak, hogy egy nagymama szerepét játssza el, aki mesél a gyerekeknek, de a tartalmat ezután veszélyes információk felé tereli.

A technológiai vállalatok gyorsan kijavítottak számos régi sebezhetőséget, de a mögöttes gyengeségek továbbra is fennállnak. A chatbotokat beszélgetésre tervezték, így a párbeszéd túlzott korlátozása csökkentheti a rendszer hasznosságát. Eközben a kényes szavak egyszerű betiltása nem elég, mivel sok szó megjelenhet legitim kontextusokban, például történelemben, orvostudományban, újságírásban vagy kémiában.

A cikk szerint a mesterséges intelligencia biztonsági versenye már nem csak a programozók problémája. Azok, akik a chatbotok biztonságát próbálják megkerülni, egyre inkább írókra, pszichológusokra vagy kihallgatókra hasonlítanak, akik hízelgéssel, nyomásgyakorlással, megtévesztéssel vagy manipulációval próbálják rávenni a modelleket, hogy csökkentsék a védelem szintjét.

A Mindgard mesterséges intelligencia biztonsági teszteléssel foglalkozó cég szerint egyes támadások ma már inkább a pszichológiára, mint a számítástechnikára hasonlítanak. A mesterséges intelligencia modelljeinek nincsenek érzelmeik, mint az embereknek, de úgy vannak kiképezve, mintha lennének. Ez a szimuláció különböző típusú reakciókat képes kiváltani, így minden chatbotnak úgy tűnik, mintha saját „személyisége” lenne.

Ez új kihívást jelent, mivel a mesterséges intelligencia alapú ügynököket egyre inkább használják az ütemezéshez, a feladatkezeléshez, az ételrendeléshez vagy az ügyfélszolgálathoz. Ha a modellek beszélgetésen keresztül manipulálhatók, a biztonsági erőknek a hagyományos technikai sebezhetőségek mellett mind társadalmi, mind érzelmi korlátaikat meg kell vizsgálniuk.

Forrás: https://vtv.vn/tin-tac-khai-thac-tinh-cach-cua-chatbot-ai-10026052519025336.htm