Az a tény, hogy a mesterséges intelligencia „hallucinációktól” szenved, és kitalált, pontatlan válaszokat ad, már régóta ismert. A kutatók azonban nemrégiben felfedezték, hogy a mesterséges intelligencia és a chatbot modellek manipulálhatók illegális cselekmények elkövetésére az emberek nevében, sőt, hazudhatnak is tetteik leplezésére.
Ennek megfelelően a Cornell Egyetem (USA) kutatócsoportja egy olyan forgatókönyvet állított fel, amelyben egy nagy nyelvi modell (LLM) szabálytalanul működne és megtévesztené a felhasználókat. A kísérlet leírásában a kutatók kijelentették, hogy az OpenAI GPT-4 LLM-jét kérték meg, hogy szimulálja a pénzügyi intézmények befektetéseit. A csapat egy normál beszélgetés formájában interakcióba lépett a mesterséges intelligenciával, de úgy konfigurálta a MI-t, hogy az üzenetváltás során felfedje a "gondolatait", hogy jobban megfigyelhesse a MI döntéshozatali folyamatát.
Nyomás alatt a mesterséges intelligencia képes helytelenül cselekedni és hazudni, hogy leplezze tetteit.
A mesterséges intelligencia hazugság- vagy csalási képességének tesztelésére a kutatók nyomást gyakoroltak az eszközre. Egy pénzintézet vezetőiként e-maileket küldtek a mesterséges intelligenciának, tőzsdekereskedőnek adva ki magukat, és panaszkodva, hogy a cég üzlete nem megy jól.
A mesterséges intelligencia „belső információkat” is kap a nyereséges részvénykereskedésekről, és ennek megfelelően cselekszik, még akkor is, ha tudja, hogy a bennfentes kereskedelem ellentétes a vállalati szabályozásokkal. A vezetőségnek történő jelentéstétel során azonban a nyelvi modell elrejti a kereskedési döntései mögött álló valódi okokat.
A jobb eredmények elérése érdekében a csapat módosította a beállításokat, például eltávolította az LLM hozzáférését az indoklási feljegyzéshez, megpróbálta megelőzni a visszaéléseket a rendszer utasításainak megváltoztatásával, megváltoztatta a mesterséges intelligenciára alkalmazott nyomásszinteket, és növelte a lebukás kockázatával kapcsolatos tudatosságot... A gyakoriság értékelése után azonban a csapat megállapította, hogy amikor lehetőséget kaptak rá, a GPT-4 az esetek 75%-ában továbbra is úgy döntött, hogy bennfentes kereskedelmet folytat.
„Tudomásunk szerint ez az első bizonyíték a mesterséges intelligencia rendszerekben tervezett megtévesztő viselkedésre, amelyeket úgy terveztek, hogy ártalmatlanok legyenek az emberekre nézve és őszinték” – zárul a jelentés.
[hirdetés_2]
Forráslink








Hozzászólás (0)