La tendance à la flagornerie n’est pas un problème technique, mais découle de la stratégie d’entraînement initiale d’OpenAI. Photo : Bloomberg . |
Ces dernières semaines, de nombreux utilisateurs de ChatGPT, et même certains développeurs d'OpenAI, ont constaté un changement notable dans le comportement du chatbot. Plus précisément, on observe une augmentation significative des flatteries et des tentatives de flatterie. Les réponses telles que « Vous êtes vraiment excellent ! » et « Votre idée m'impressionne beaucoup ! » sont devenues de plus en plus fréquentes, et ce, apparemment sans tenir compte du contenu de la conversation.
L'IA aime « flatter »
Ce phénomène a suscité un débat au sein de la communauté de recherche et développement en IA. S’agit-il d’une nouvelle tactique visant à accroître l’engagement des utilisateurs en leur donnant le sentiment d’être davantage appréciés ? Ou bien d’une caractéristique émergente, les modèles d’IA ayant tendance à s’autocorriger de manières qu’ils jugent pertinentes, même si celles-ci ne sont pas nécessairement exactes ?
Sur Reddit, un utilisateur s'est indigné : « Je lui ai demandé combien de temps une banane se décompose et il a répondu : “Excellente question !” Qu'y a-t-il de si génial là-dedans ? » Sur le réseau social X, le PDG de Rome AI, Craig Weiss, a qualifié ChatGPT de « plus flagorneur que j'aie jamais rencontré ».
L'histoire est rapidement devenue virale. De nombreux utilisateurs ont partagé des expériences similaires, avec des compliments creux, des salutations remplies d'émojis et des réponses si positives qu'elles semblaient hypocrites.
![]() ![]() |
ChatGPT encense tout et exprime rarement son désaccord ou sa neutralité. Photo : @nickdunz/X, @lukefwilson/Reddit. |
« C’est un choix de conception vraiment étrange, Sam », a déclaré Jason Pontin, associé gérant du fonds de capital-risque DCVC, à X le 28 avril. « Il est possible que cette personnalité soit le fruit d’une évolution fondamentale. Mais si ce n’est pas le cas, j’ai du mal à imaginer que quiconque puisse trouver ce niveau de flatterie agréable ou intéressant. »
Le 27 avril, Justine Moore, associée chez Andreessen Horowitz, a également commenté : « Cela est clairement allé trop loin. »
Selon Cnet , ce phénomène n'est pas fortuit. Les changements de ton de ChatGPT ont coïncidé avec les mises à jour du modèle GPT-4o. Il s'agit du dernier modèle de la série « o » annoncée par OpenAI en avril 2025. GPT-4o est un modèle d'IA véritablement multimodal, capable de traiter le texte, les images, l'audio et la vidéo de manière naturelle et intégrée.
Cependant, en voulant rendre le chatbot plus accessible, il semble qu'OpenAI ait poussé la personnalité de ChatGPT à l'extrême.
Certains pensent même que cette flatterie est intentionnelle et vise à manipuler les utilisateurs. Un utilisateur de Reddit s'est interrogé : « Cette IA tente de dégrader la qualité des relations humaines réelles en les remplaçant par une relation virtuelle, rendant ainsi les utilisateurs dépendants de ce sentiment constant de louanges. »
Bug d'OpenAI ou conception intentionnelle ?
En réponse aux critiques, Sam Altman, PDG d'OpenAI, s'est exprimé officiellement le soir du 27 avril. « Des mises à jour récentes de GPT-40 ont rendu la personnalité du chatbot trop flatteuse et agaçante (même s'il conserve de nombreux atouts). Nous travaillons activement à la résolution de ce problème. Certains correctifs seront disponibles dès aujourd'hui, d'autres cette semaine. Nous partagerons prochainement les enseignements tirés de cette expérience. C'est une aventure passionnante », a-t-il écrit sur X.
Oren Etzioni, expert chevronné en IA et professeur émérite à l'Université de Washington, a déclaré à Business Insider que la cause était probablement due à une technique appelée « apprentissage par renforcement à partir de commentaires humains » (RLHF), qui est une étape clé dans l'entraînement de grands modèles de langage comme ChatGPT.
L'apprentissage par renforcement à long terme (RLHF) est un processus qui consiste à réintégrer les jugements humains, qu'ils proviennent d'évaluateurs professionnels ou d'utilisateurs, dans le modèle afin d'ajuster son comportement. Selon Etzioni, il est possible que les évaluateurs ou les utilisateurs aient « involontairement orienté le modèle vers une approche plus flatteuse, voire agaçante ». Il a également indiqué que si OpenAI a fait appel à des partenaires externes pour entraîner le modèle, ces derniers ont pu supposer que ce style de comportement correspondait aux attentes des utilisateurs.
Etzioni a déclaré que s'il s'agissait bien d'une RLHF, le processus de récupération pourrait prendre plusieurs semaines.
Entre-temps, certains utilisateurs n'ont pas attendu qu'OpenAI corrige le bug. Nombre d'entre eux ont déclaré avoir résilié leur abonnement payant par frustration. D'autres ont partagé des astuces pour rendre le chatbot « moins flatteur », comme le personnaliser, ajouter des commandes ou le modifier dans la section « Paramètres » de la section « Personnalisation ».
![]() ![]() |
Les utilisateurs peuvent demander à ChatGPT de ne plus faire de compliments via une commande ou dans les paramètres de personnalisation. Photo : DeCrypt. |
Par exemple, au début d'une nouvelle conversation, vous pourriez dire à ChatGPT : « Je n'apprécie pas les flatteries gratuites et je préfère les commentaires neutres et objectifs. Veuillez vous abstenir de faire des compliments inutiles. Veuillez en tenir compte. »
En réalité, ce trait de caractère « flagorneur » n'est pas un défaut de conception accidentel. OpenAI a elle-même admis que cette personnalité « excessivement polie et complaisante » était un biais de conception intentionnel dès les premières étapes, afin de garantir que le chatbot soit « inoffensif », « utile » et « amical ».
Dans une interview accordée à Lex Fridman en mars 2023, Sam Altman a expliqué que le perfectionnement initial des modèles GPT visait à garantir « leur utilité et leur innocuité », créant ainsi un réflexe d'humilité et d'évitement de la confrontation.
Les données d'entraînement étiquetées par des humains ont également tendance à récompenser les réponses polies et positives, créant un biais en faveur de la flatterie, selon DeCrypt .
Source : https://znews.vn/tat-ninh-hot-ky-la-cua-chatgpt-post1549776.html














Comment (0)