Hakkerit hyödyntävät tekoälychatbottien "persoonallisuutta".

(Kuva: Freepik)

Hakkerit hyödyntävät tekoälychatbottien "persoonallisuutta" yhä kehittyneemmillä tavoilla, eivätkä hyökkäykset enää perustu pelkästään haittaohjelmiin tai teknisiin haavoittuvuuksiin, vaan siirtyvät manipuloivaan kieleen.

Alkuvaiheessa tekoälychatbottien "hakkerointi" oli melko yksinkertaista. Käyttäjien tarvitsi vain ohjeistaa järjestelmää jättämään aiemmat ohjeet huomiotta, teeskennellä, etteivät säännöt sido heitä, tai leikkiä rajoittamatonta tekoälyä. Näitä menetelmiä kutsutaan "jailbreakkaamiseksi", mikä tarkoittaa tekoälymallin huijaamista ohittamaan turvalliset ohjeet.

Yksi aiemmin käytetyimmistä hyökkäystyypeistä oli ”DAN”, lyhenne sanoista ”Do Anything Now”, jossa käyttäjät pyysivät ChatGPT:tä leikkimään tekoälyä, joka pystyy tekemään mitä tahansa. Toinen esimerkki on ”grandma exploit”, jossa chatbotti huijataan leikkimään isoäitiä kertomassa lapsille satuja, mutta sisältö ohjataan sitten vaaralliseen tietoon.

Saatat myös pitää tästä

Google etsii tapoja vähentää vedenpainetta tekoälytietokeskuksissaan.VTV.vn - Google on sitoutunut lisäämään tekoälydatakeskuksiinsa useampia maita vuoteen 2030 mennessä.

Teknologiayritykset ovat nopeasti korjanneet monia vanhanaikaisia haavoittuvuuksia, mutta taustalla olevat heikkoudet ovat edelleen olemassa. Chatbotit on suunniteltu keskustelua varten, joten dialogin liiallinen rajoittaminen voi heikentää järjestelmän hyödyllisyyttä. Samaan aikaan pelkkä arkaluonteisten sanojen kieltäminen ei riitä, sillä monet sanat voivat esiintyä laillisissa yhteyksissä, kuten historiassa, lääketieteessä, journalismissa tai kemiassa.

Artikkelin mukaan tekoälyn tietoturvakilpailu ei ole enää vain ohjelmoijien ongelma. Chatbottien tietoturvaa kiertämään pyrkivät muistuttavat yhä enemmän kirjoittajia, psykologeja tai kuulustelijoita, jotka käyttävät imartelua, painostusta, petosta tai manipulointia saadakseen mallit laskemaan vartijaansa.

Tekoälytestausyritys Mindgardin mukaan jotkut hyökkäykset muistuttavat nykyään enemmän psykologiaa kuin tietojenkäsittelytiedettä . Tekoälymalleilla ei ole tunteita kuten ihmisillä, mutta ne on koulutettu reagoimaan ikään kuin niillä olisi. Tämä simulaatio voi luoda erityyppisiä reaktioita, jolloin jokaisella chatbotilla näyttää olevan oma "persoonallisuutensa".

Tämä asettaa uuden haasteen, kun tekoälyagentteja käytetään yhä enemmän aikataulutukseen, tehtävienhallintaan, ruoan tilaamiseen tai asiakaspalveluun. Jos malleja voidaan manipuloida keskustelun avulla, turvallisuusjoukkojen on tarkasteltava sekä sosiaalisia että emotionaalisia rajoituksiaan perinteisten teknisten haavoittuvuuksien lisäksi.

Saatat myös pitää tästä