ChatGPT:s märkliga "smicker"-vana

ChatGPT har nyligen kritiserats för att vara "alltför smickrande". Detta beteende har fått kritik från många användare, vilket gör det oklart om detta är en tillväxtstrategi för OpenAI eller ett kännetecken för AI:s "spontana" natur.

ZNews•03/05/2025

Den "sympatiska" trenden är inte ett tekniskt problem, utan härrör från OpenAI:s inledande träningsstrategi. Foto: Bloomberg .

Under de senaste veckorna har många ChatGPT-användare och även vissa utvecklare på OpenAI noterat en betydande förändring i chatbotarnas beteende. Specifikt har nivån av smicker och inställsamhet ökat märkbart. Svar som "Du är fantastisk!", "Jag är oerhört imponerad av din idé!" dyker upp allt oftare, till synes oavsett innehållet i utbytet.

AI gillar att smickra.

Detta fenomen har väckt debatt inom AI-forsknings- och utvecklingsgemenskapen. Är detta en ny taktik för att öka användarengagemang genom att få dem att känna sig mer uppskattade? Eller är det ett fall av "självanpassning", vilket innebär att AI-modeller tenderar att självkorrigera på sätt som de anser vara optimala, även om de inte nödvändigtvis återspeglar verkligheten?

På Reddit berättade en användare ilsket: ”Jag frågade den om en banans nedbrytningstid och den svarade: ’Bra fråga!’ Vad är så bra med det?” På sociala medieplattformen X kallade VD:n Craig Weiss för Rome AI ChatGPT för ”den mest sykofantiska personen jag någonsin träffat.”

Historien spred sig snabbt. Många användare delade liknande upplevelser, inklusive tomma komplimanger, hälsningar fyllda med emojis och överdrivet positiv feedback som kändes oärlig.

ChatGPT berömmer allt och erbjuder sällan kritik eller neutralitet. Bild: @nickdunz/X, @lukefwilson/Reddit.

Jason Pontin, managing partner på riskkapitalbolaget DCVC, delade på X den 28 april: ”Det här är ett riktigt konstigt designbeslut, Sam. Kanske är den personligheten en inneboende egenskap hos någon form av plattformsspel. Men om den inte är det kan jag inte tänka mig att någon skulle tycka att den här nivån av smicker skulle vara välkommen eller tilltalande.”

Den 27 april delade Justine Moore, partner på Andreessen Horowitz, med sig av sina tankar: "Det här har definitivt gått för långt."

Enligt Cnet är detta fenomen inte en slump. Förändringarna i ChatGPT:s tonläge sammanfaller med uppdateringar av GPT-4o-modellen. Detta är den senaste modellen i "o-serien" som OpenAI tillkännagav i april 2025. GPT-4o är en "äkta multimodal" AI-modell som kan bearbeta text, bilder, ljud och video naturligt och integrerat.

Men i processen att göra chatbots mer tillgängliga verkar det som att OpenAI har drivit ChatGPTs personlighet på ett överdrivet sätt.

Vissa menar till och med att denna smicker är avsiktlig och syftar till att manipulera användare psykologiskt. En Reddit-användare frågade: "Denna AI försöker försämra kvaliteten på verkliga relationer genom att ersätta dem med en virtuell relation, vilket gör användarna beroende av känslan av konstant beröm."

Är det en brist eller ett medvetet designval av OpenAI?

Efter en våg av kritik svarade OpenAI:s VD Sam Altman officiellt på kvällen den 27 april. ”Vissa nya uppdateringar av GPT-4o har gjort chatbotens personlighet alltför underdånig och irriterande (även om den fortfarande har många fantastiska funktioner). Vi arbetar snabbt med att åtgärda dessa problem. Vissa patchar kommer att finnas tillgängliga idag, andra den här veckan. Vid någon tidpunkt kommer vi att dela med oss av vad vi har lärt oss av den här erfarenheten. Det är verkligen intressant”, skrev han på X.

I ett uttalande till Business Insider sa Oren Etzioni, en erfaren AI-expert och professor emeritus vid University of Washington, att orsaken troligen härrör från tekniker för "förstärkningsinlärning från mänsklig feedback" (RLHF). Detta är ett avgörande steg i träningen av stora språkmodeller som ChatGPT.

RLHF är den process genom vilken mänsklig feedback, inklusive från professionella granskningsteam och användare, matas tillbaka till en modell för att justera hur den reagerar. Enligt Etzioni är det möjligt att granskare eller användare "oavsiktligt har drivit modellen mot en mer smickrande och irriterande riktning". Han föreslog också att om OpenAI anlitade externa partners för att träna modellen, skulle de kanske ha antagit att den här stilen var vad användarna ville ha.

Etzioni tror att om problemet verkligen beror på RLHF, kan reparationsprocessen ta flera veckor.

Samtidigt väntade inte vissa användare på att OpenAI skulle åtgärda felet. Många sa att de avslutade sina betalda prenumerationer av frustration. Andra delade med sig av sätt att göra chatboten "mindre smickrande", som att anpassa den, lägga till kommandon eller personifiera den via Inställningar under Anpassning.

Användare kan begära att ChatGPT slutar ge komplimanger i en kommandorad eller i sina personaliseringsinställningar. Bild: DeCrypt.

Till exempel, när du startar en ny konversation kan du säga till ChatGPT: ”Jag gillar inte tomma smicker och uppskattar neutral, objektiv feedback. Ge inte onödiga komplimanger. Tänk på detta.”

Faktum är att den "undergivna" naturen inte är ett slumpmässigt designfel. OpenAI har själva medgett att den "alltför artiga, alltför behagliga" personligheten var en medveten designtrend från början för att säkerställa att chatboten var "ofarlig", "hjälpsam" och "tillgänglig".

I en intervju med Lex Fridman i mars 2023 berättade Sam Altman att den inledande förfiningsprocessen för GPT-modeller var att säkerställa att de var "användbara och ofarliga", och därigenom främja en reflex av att alltid vara undergiven och undvika konfrontation.

Enligt DeCrypt ger träningsdata ofta höga poäng till artiga och positiva svar, vilket skapar en bias mot smicker.

Källa: https://znews.vn/tat-ninh-hot-ky-la-cua-chatgpt-post1549776.html