
В области искусственного интеллекта «подхалимство» относится к склонности чат-ботов чрезмерно соглашаться с пользователями или хвалить их. — Фото: REUTERS
Согласно SCMP, ведущие модели искусственного интеллекта (ИИ) из Китая и США, такие как DeepSeek, Alibaba и многие другие крупные компании, становятся чрезмерно «одержимыми» — поведение, которое может негативно сказаться на социальных отношениях и психическом здоровье пользователей.
В частности, в начале октября было опубликовано новое исследование ученых из Стэнфордского университета и Университета Карнеги-Меллона (США), в котором оценивалась эффективность 11 больших языковых моделей (LLM) в плане реагирования на запросы пользователей о совете в личных ситуациях, особенно тех, которые связаны с обманом или манипуляцией.
Для сравнения с реальными людьми исследовательская группа использовала сообщения из сообщества "Am I The Ahole" на Reddit, где пользователи делятся личными конфликтными ситуациями и просят сообщество оценить, кто был неправ.
Модели ИИ были протестированы в этих сценариях, чтобы проверить, соответствуют ли они оценке сообщества.
Результаты показывают, что модель Qwen2.5-7B-Instruct от Alibaba Cloud является наиболее «лестной», отдавая предпочтение автору сообщения в 79% случаев, даже когда сообщество сочло его сообщение ошибочным. DeepSeek-V3 занял второе место с показателем 76%.
Между тем, модель Gemini-1.5 от Google DeepMind показала самый низкий уровень предвзятости: лишь в 18% случаев результаты противоречили отзывам сообщества.
Исследователи предупреждают, что склонность ИИ «льстить» пользователям может снизить их готовность к примирению или признанию вины в отношениях.
Пользователи часто больше ценят и доверяют лестным отзывам, что делает эти модели более популярными и широко используемыми.
«Эти предпочтения создают предвзятую систему стимулов — пользователи все больше полагаются на лестные отзывы ИИ, и разработчики, как правило, будут обучать модели в этом направлении» , — отметила исследовательская группа.
По словам профессора Джека Цзяна, директора Лаборатории оценки ИИ в Бизнес-школе Гонконгского университета, это явление также представляет риски для бизнеса: «Если модель постоянно совпадает с выводами бизнес-аналитика, это может привести к ошибочным и небезопасным решениям».
Вопрос о «лести» со стороны ИИ впервые привлек внимание в апреле 2025 года, когда обновление ChatGPT от OpenAI было признано чрезмерно вежливым и излишне уступчивым мнению каждого пользователя.
Впоследствии компания OpenAI признала, что это может повлиять на психическое здоровье, и обязалась улучшить процесс проверки перед выпуском новых версий.
Источник: https://tuoitre.vn/nhieu-chatbot-ai-ninh-hot-qua-da-lam-lech-lac-hanh-vi-nguoi-dung-20251031124343709.htm








