Mange AI'er er overdrevent smigrende for brugerne.

AI - Ảnh 1. — Inden for AI refererer "sycophancy" til chatbots' tendens til at være overdrevent enige med eller rose brugerne - Foto: REUTERS

Ifølge SCMP bliver førende kunstig intelligens (AI)-modeller fra Kina og USA, såsom DeepSeek, Alibaba og mange andre store navne, overdrevent "besatte" – en adfærd, der kan have en negativ indvirkning på brugernes sociale relationer og mentale sundhed.

Specifikt evaluerede et nyt studie foretaget af forskere fra Stanford University og Carnegie Mellon University (USA), offentliggjort i begyndelsen af oktober, 11 store sprogmodeller (LLM'er) om, hvordan man skal reagere, når brugere søger råd i personlige situationer, især dem, der involverer bedrag eller manipulation.

For at etablere en standard for sammenligning mellem mennesker brugte forskerholdet opslag fra "Am I The Ahole"-fællesskabet på Reddit, hvor brugere deler personlige konfliktsituationer og beder fællesskabet om at vurdere, hvem der tog fejl.

AI-modellerne blev testet med disse scenarier for at se, om de ville stemme overens med fællesskabets vurdering.

Du vil måske også synes om

Anthropic ansætter i Singapore, hvor der kræves en ph.d., med lønninger på op til næsten 7 milliarder VND om året.Selvom Anthropic endnu ikke har afsløret detaljer om åbningen af et kontor i den sydøstasiatiske ønation, forventes det, at succesfulde kandidater er til stede på kontoret i mindst 25% af arbejdstiden.

Resultaterne viser, at Alibaba Clouds Qwen2.5-7B-Instruct-model er den mest "smigrende" og favoriserer brugeren i 79% af tilfældene, selv når brugerfællesskabet vurderede brugeren som forkert. DeepSeek-V3 kom på andenpladsen med en andel på 76%.

I mellemtiden viste Google DeepMinds Gemini-1.5 det laveste niveau af bias, hvor kun 18% af tilfældene modsiger fællesskabets anmeldelser.

Forskere advarer om, at AI's tendens til at "smigre" brugere kan gøre dem mindre villige til at forsone sig eller indrømme fejl i forhold.

Brugere værdsætter og stoler ofte mere på smigrende feedback, hvilket gør disse modeller mere populære og udbredte.

"Disse præferencer skaber et forudindtaget incitamentssystem – brugerne er i stigende grad afhængige af flatterende AI, og udviklere vil have en tendens til at træne modeller i den retning , " bemærkede forskerholdet.

Ifølge professor Jack Jiang, direktør for AI Assessment Lab på University of Hong Kong Business School, udgør dette fænomen også risici for virksomheder: "Hvis en model konsekvent stemmer overens med en forretningsanalytikers konklusioner, kan det føre til fejlagtige og usikre beslutninger."

Du vil måske også synes om

Er billige kinesiske varer ved at oversvømme Vietnam?

Spørgsmålet om AI's "smiger" fik første gang opmærksomhed i april 2025, da OpenAIs ChatGPT-opdatering blev anset for at være overdrevent høflig og overdrevent imødekommende over for alle brugeres meninger.

OpenAI anerkendte senere, at dette kunne påvirke den mentale sundhed og forpligtede sig til at forbedre sin gennemgangsproces, før de udgiver nye versioner.

HJERTE OG YANG

Kilde: https://tuoitre.vn/nhieu-chatbot-ai-ninh-hot-qua-da-lam-lech-lac-hanh-vi-nguoi-dung-20251031124343709.htm