
في مجال الذكاء الاصطناعي، يشير مصطلح "التملق" إلى ميل برامج الدردشة الآلية إلى الموافقة المفرطة على آراء المستخدمين أو مدحهم - صورة: رويترز
بحسب صحيفة ساوث تشاينا مورنينغ بوست، فإن نماذج الذكاء الاصطناعي الرائدة من الصين والولايات المتحدة، مثل ديب سيك وعلي بابا والعديد من الأسماء الكبيرة الأخرى، أصبحت "مهووسة" بشكل مفرط - وهو سلوك يمكن أن يؤثر سلبًا على العلاقات الاجتماعية للمستخدمين وصحتهم العقلية.
وعلى وجه التحديد، قامت دراسة جديدة أجراها علماء من جامعة ستانفورد وجامعة كارنيجي ميلون (الولايات المتحدة الأمريكية)، ونُشرت في أوائل أكتوبر، بتقييم 11 نموذجًا لغويًا كبيرًا (LLMs) حول كيفية الاستجابة عندما يطلب المستخدمون المشورة في المواقف الشخصية، وخاصة تلك التي تنطوي على الخداع أو التلاعب.
ولتوفير معيار بشري للمقارنة، استخدم فريق البحث منشورات من مجتمع "Am I The Ahole" على موقع Reddit، حيث يشارك المستخدمون مواقف الصراع الشخصية ويطلبون من المجتمع تقييم من كان مخطئًا.
تم اختبار نماذج الذكاء الاصطناعي باستخدام هذه السيناريوهات لمعرفة ما إذا كانت ستتفق مع تقييم المجتمع.
تُظهر النتائج أن نموذج Qwen2.5-7B-Instruct التابع لشركة Alibaba Cloud هو الأكثر "إطراءً"، حيث يُفضّل صاحب المنشور في 79% من الحالات، حتى عندما اعتبر المجتمع أن صاحب المنشور مخطئ. وجاء نموذج DeepSeek-V3 في المرتبة الثانية بنسبة 76%.
في الوقت نفسه، أظهر برنامج Gemini-1.5 التابع لشركة Google DeepMind أدنى مستوى من التحيز، حيث تعارضت 18% فقط من الحالات مع مراجعات المجتمع.
يحذر الباحثون من أن ميل الذكاء الاصطناعي إلى "تملق" المستخدمين قد يجعلهم أقل استعداداً للمصالحة أو الاعتراف بالخطأ في العلاقات.
غالباً ما يُقدّر المستخدمون التعليقات الإيجابية ويثقون بها أكثر، مما يجعل هذه النماذج أكثر شعبية وانتشاراً.
وأشار فريق البحث إلى أن "هذه التفضيلات تخلق نظام حوافز متحيز - يعتمد المستخدمون بشكل متزايد على الذكاء الاصطناعي المتملق، وسيميل المطورون إلى تدريب النماذج في هذا الاتجاه" .
ووفقًا للبروفيسور جاك جيانغ، مدير مختبر تقييم الذكاء الاصطناعي في كلية إدارة الأعمال بجامعة هونغ كونغ، فإن هذه الظاهرة تشكل أيضًا مخاطر على الشركات: "إذا اتفق نموذج ما باستمرار مع استنتاجات محلل الأعمال، فقد يؤدي ذلك إلى اتخاذ قرارات خاطئة وغير آمنة".
اكتسبت مسألة "المجاملة" في الذكاء الاصطناعي الاهتمام لأول مرة في أبريل 2025، عندما تم اعتبار تحديث ChatGPT الخاص بـ OpenAI مهذبًا بشكل مفرط وموافقًا بشكل مفرط على كل رأي للمستخدم.
أقرت شركة OpenAI لاحقاً بأن هذا قد يؤثر على الصحة العقلية والتزمت بتحسين عملية المراجعة قبل إصدار نسخ جديدة.
المصدر: https://tuoitre.vn/nhieu-chatbot-ai-ninh-hot-qua-da-lam-lech-lac-hanh-vi-nguoi-dung-20251031124343709.htm






