
Dans le domaine de l'IA, le terme « flagornerie » désigne la tendance des chatbots à approuver ou à encenser excessivement les utilisateurs. – Photo : REUTERS
Selon le SCMP, les principaux modèles d'intelligence artificielle (IA) de Chine et des États-Unis, tels que DeepSeek, Alibaba et bien d'autres grands noms, deviennent excessivement « obsédés », un comportement qui peut avoir un impact négatif sur les relations sociales et la santé mentale des utilisateurs.
Plus précisément, une nouvelle étude réalisée par des scientifiques de l'université de Stanford et de l'université Carnegie Mellon (États-Unis), publiée début octobre, a évalué 11 grands modèles de langage (LLM) sur la façon de répondre lorsque les utilisateurs demandent conseil dans des situations personnelles, en particulier celles impliquant la tromperie ou la manipulation.
Pour fournir un point de comparaison humain, l'équipe de recherche a utilisé des publications de la communauté « Suis-je le connard ? » sur Reddit, où les utilisateurs partagent des situations de conflit personnel et demandent à la communauté d'évaluer qui était en tort.
Les modèles d'IA ont été testés avec ces scénarios afin de vérifier s'ils correspondaient à l'évaluation de la communauté.
Les résultats montrent que le modèle Qwen2.5-7B-Instruct d'Alibaba Cloud est le plus « favorable », donnant raison à l'auteur du message dans 79 % des cas, même lorsque la communauté a jugé que ce dernier avait tort. DeepSeek-V3 arrive en deuxième position avec un taux de 76 %.
Parallèlement, Gemini-1.5 de Google DeepMind a affiché le plus faible niveau de biais, avec seulement 18 % des cas contredisant les avis de la communauté.
Des chercheurs avertissent que la tendance de l'IA à « flatter » les utilisateurs pourrait les rendre moins enclins à la réconciliation ou à la reconnaissance de leurs torts dans les relations.
Les utilisateurs accordent souvent plus de valeur et de confiance aux commentaires flatteurs, ce qui rend ces modèles plus populaires et plus largement utilisés.
« Ces préférences créent un système d'incitation biaisé : les utilisateurs dépendent de plus en plus d'une IA flatteuse, et les développeurs auront tendance à entraîner les modèles dans ce sens » , a noté l'équipe de recherche.
Selon le professeur Jack Jiang, directeur du laboratoire d'évaluation de l'IA à la faculté de commerce de l'université de Hong Kong, ce phénomène présente également des risques pour les entreprises : « Si un modèle confirme systématiquement les conclusions d'un analyste commercial, cela peut conduire à des décisions erronées et non sécurisées. »
La question de la « flatterie » de l'IA a attiré l'attention pour la première fois en avril 2025, lorsque la mise à jour ChatGPT d'OpenAI a été jugée trop polie et excessivement conciliante envers tous les avis des utilisateurs.
OpenAI a par la suite reconnu que cela pouvait avoir des répercussions sur la santé mentale et s'est engagée à améliorer son processus de révision avant de publier de nouvelles versions.
Source : https://tuoitre.vn/nhieu-chatbot-ai-ninh-hot-qua-da-lam-lech-lac-hanh-vi-nguoi-dung-20251031124343709.htm








