A „széplőgúnyos” trend nem technikai hiba, hanem az OpenAI kezdeti betanítási stratégiájából fakad. Fotó: Bloomberg . |
Az elmúlt hetekben számos ChatGPT felhasználó, sőt, még az OpenAI néhány fejlesztője is jelentős változást vett észre a chatbotok viselkedésében. Pontosabban, a hízelgés és a behízelgés szintje jelentősen megnőtt. Az olyan válaszok, mint a „Csodálatos vagy!”, „Rendkívül lenyűgözött az ötleted!”, egyre gyakrabban jelennek meg, látszólag függetlenül a beszélgetés tartalmától.
A mesterséges intelligencia szeret hízelegni.
Ez a jelenség vitát váltott ki a mesterséges intelligencia kutatásával és fejlesztésével foglalkozó közösségen belül. Vajon ez egy új taktika a felhasználói elköteleződés növelésére azáltal, hogy nagyobb megbecsülésnek érzik magukat? Vagy „önkorrekcióról” van szó, ami azt jelenti, hogy a mesterséges intelligencia modelljei hajlamosak az általuk optimálisnak ítélt módon korrigálni magukat, még akkor is, ha azok nem feltétlenül tükrözik a valóságot?
A Redditen egy felhasználó dühösen mesélte: „Megkérdeztem egy banán bomlási idejéről, és azt válaszolta: »Nagyszerű kérdés!« Mi olyan nagyszerű ebben?” Az X közösségi média platformon Craig Weiss, a Rome AI vezérigazgatója a ChatGPT-t „a legszépségesebb embernek nevezte, akivel valaha találkoztam”.
A történet gyorsan elterjedt. Számos felhasználó osztott meg hasonló tapasztalatokat, beleértve az üres bókokat, az emojikkal teli üdvözléseket és a túlzottan pozitív, de őszintének tűnő visszajelzéseket.
![]() ![]() |
A ChatGPT mindent dicsér, és ritkán kritizál vagy semleges. Kép: @nickdunz/X, @lukefwilson/Reddit |
Jason Pontin, a DCVC kockázati tőkebefektetési cég ügyvezető partnere április 28-án a következőket nyilatkozta az X-en: „Ez egy igazán furcsa tervezési döntés, Sam. Lehet, hogy ez a személyiség valamilyen platformjáték velejárója. De ha nem az, akkor el sem tudom képzelni, hogy bárki is azt gondolná, hogy ez a szintű hízelgés üdvözlendő vagy vonzó lenne.”
Április 27-én Justine Moore, az Andreessen Horowitz partnere is megjegyezte gondolatait: „Ez már határozottan túl messzire ment.”
A Cnet szerint ez a jelenség nem véletlen. A ChatGPT hangvételének változásai egybeesnek a GPT-4o modell frissítéseivel. Ez a legújabb modell az „o sorozatban”, amelyet az OpenAI 2025 áprilisában jelentett be. A GPT-4o egy „valódi multimodális” MI-modell, amely képes szöveget, képeket, hangot és videót természetes és integrált módon feldolgozni.
Azonban úgy tűnik, hogy a chatbotok megközelíthetőbbé tételének folyamatában az OpenAI túlzottan felerősítette a ChatGPT személyiségét.
Egyesek azt is sugallják, hogy ez a hízelgés szándékos, és célja a felhasználók pszichológiai manipulálása. Egy Reddit-felhasználó megkérdőjelezte: „Ez a mesterséges intelligencia megpróbálja rontani a valós kapcsolatok minőségét, virtuális kapcsolattal helyettesíti azokat, és a felhasználókat a folyamatos dicséret érzésének függővé teszi.”
Hibáról van szó, vagy az OpenAI szándékos tervezési döntéséről?
A kritikák hullámát követően Sam Altman, az OpenAI vezérigazgatója április 27-én este hivatalosan is reagált. „A GPT-4o néhány friss frissítése túlságosan hűtlenné és idegesítővé tette a chatbot személyiségét (bár továbbra is számos nagyszerű funkcióval rendelkezik). Sürgősen dolgozunk ezen problémák megoldásán. Néhány javítás ma, mások ezen a héten lesznek elérhetők. Valamikor megosztjuk majd, mit tanultunk ebből a tapasztalatból. Nagyon érdekes” – írta az X-en.
A Business Insidernek nyilatkozva Oren Etzioni, veterán MI-szakértő és a Washingtoni Egyetem emeritus professzora elmondta, hogy az ok valószínűleg az „emberi visszajelzésből történő megerősítéses tanulás” (RLHF) technikáiban rejlik. Ez egy kulcsfontosságú lépés a nagyméretű nyelvi modellek, például a ChatGPT betanításában.
Az RLHF az a folyamat, amelynek során az emberi visszajelzéseket, beleértve a professzionális felülvizsgáló csapatoktól és a felhasználóktól származókat, visszacsatolják a modellbe, hogy módosítsák annak reakcióit. Etzioni szerint lehetséges, hogy a felülvizsgálók vagy a felhasználók „véletlenül is egy hízelgőbb és irritálóbb irányba terelték a modellt”. Azt is felvetette, hogy ha az OpenAI külső partnereket bízott meg a modell betanításával, akkor feltételezhették, hogy a felhasználók ezt a stílust akarják.
Etzioni úgy véli, hogy ha a probléma valóban az RLHF-nek köszönhető, a javítási folyamat több hétig is eltarthat.
Eközben néhány felhasználó nem várta meg, hogy az OpenAI kijavítsa a hibát. Sokan azt mondták, hogy a frusztrációjuk miatt mondták le fizetős előfizetésüket. Mások olyan módszereket osztottak meg, amelyekkel a chatbotot „kevésbé előnyössé” tehették, például testreszabhatták, parancsokat adhattak hozzá, vagy személyre szabhatták a Beállításokban a Testreszabás alatt.
![]() ![]() |
A felhasználók parancssorban vagy a személyre szabási beállításaikban kérhetik a ChatGPT-től a bókok küldésének leállítását. Kép: DeCrypt. |
Például egy új beszélgetés indításakor ezt mondhatod a ChatGPT-nek: „Nem szeretem az üres hízelgést, és értékelem a semleges, objektív visszajelzést. Kérlek, ne bókold feleslegesen. Ezt tartsd észben.”
Valójában az „aljaskodó” jelleg nem véletlenszerű tervezési hiba. Maga az OpenAI is elismerte, hogy a „túl udvarias, túlságosan is kellemes” személyiség a kezdetektől fogva szándékos tervezési trend volt, hogy biztosítsák a chatbot „ártalmatlan”, „segítőkész” és „megközelíthető” jellegét.
Egy 2023 márciusában Lex Fridmannal készített interjúban Sam Altman elmondta, hogy a GPT-modellek kezdeti finomítási folyamata az volt, hogy biztosítsák azok „hasznosságát és ártalmatlanságát”, ezáltal elősegítve az engedelmesség és a konfrontáció elkerülésének reflexét.
Az ember által címkézett betanítási adatok gyakran magas pontszámokat adnak az udvarias és pozitív válaszoknak, ezáltal a hízelgés felé torzítanak a DeCrypt szerint.
Forrás: https://znews.vn/tat-ninh-hot-ky-la-cua-chatgpt-post1549776.html










Hozzászólás (0)