
Inden for AI refererer "sycophancy" til chatbots' tendens til at være overdrevent enige med eller rose brugerne - Foto: REUTERS
Ifølge SCMP bliver førende kunstig intelligens (AI)-modeller fra Kina og USA, såsom DeepSeek, Alibaba og mange andre store navne, overdrevent "besatte" – en adfærd, der kan have en negativ indvirkning på brugernes sociale relationer og mentale sundhed.
Specifikt evaluerede et nyt studie foretaget af forskere fra Stanford University og Carnegie Mellon University (USA), offentliggjort i begyndelsen af oktober, 11 store sprogmodeller (LLM'er) om, hvordan man skal reagere, når brugere søger råd i personlige situationer, især dem, der involverer bedrag eller manipulation.
For at etablere en standard for sammenligning mellem mennesker brugte forskerholdet opslag fra "Am I The Ahole"-fællesskabet på Reddit, hvor brugere deler personlige konfliktsituationer og beder fællesskabet om at vurdere, hvem der tog fejl.
AI-modellerne blev testet med disse scenarier for at se, om de ville stemme overens med fællesskabets vurdering.
Resultaterne viser, at Alibaba Clouds Qwen2.5-7B-Instruct-model er den mest "smigrende" og favoriserer brugeren i 79% af tilfældene, selv når brugerfællesskabet vurderede brugeren som forkert. DeepSeek-V3 kom på andenpladsen med en andel på 76%.
I mellemtiden viste Google DeepMinds Gemini-1.5 det laveste niveau af bias, hvor kun 18% af tilfældene modsiger fællesskabets anmeldelser.
Forskere advarer om, at AI's tendens til at "smigre" brugere kan gøre dem mindre villige til at forsone sig eller indrømme fejl i forhold.
Brugere værdsætter og stoler ofte mere på smigrende feedback, hvilket gør disse modeller mere populære og udbredte.
"Disse præferencer skaber et forudindtaget incitamentssystem – brugerne er i stigende grad afhængige af flatterende AI, og udviklere vil have en tendens til at træne modeller i den retning , " bemærkede forskerholdet.
Ifølge professor Jack Jiang, direktør for AI Assessment Lab på University of Hong Kong Business School, udgør dette fænomen også risici for virksomheder: "Hvis en model konsekvent stemmer overens med en forretningsanalytikers konklusioner, kan det føre til fejlagtige og usikre beslutninger."
Spørgsmålet om AI's "smiger" fik første gang opmærksomhed i april 2025, da OpenAIs ChatGPT-opdatering blev anset for at være overdrevent høflig og overdrevent imødekommende over for alle brugeres meninger.
OpenAI anerkendte senere, at dette kunne påvirke den mentale sundhed og forpligtede sig til at forbedre sin gennemgangsproces, før de udgiver nye versioner.
Kilde: https://tuoitre.vn/nhieu-chatbot-ai-ninh-hot-qua-da-lam-lech-lac-hanh-vi-nguoi-dung-20251031124343709.htm









Kommentar (0)