ارزیابی اخلاقی سیستم‌های خودمختار

محققان MIT یک چارچوب آزمایشی ایجاد کرده‌اند که به شناسایی موقعیت‌هایی که سیستم‌های پشتیبانی تصمیم‌گیری هوش مصنوعی در تضمین عدالت برای افراد و جوامع شکست می‌خورند، کمک می‌کند.

VietNamNet•23/04/2026

تصویر درس ۳۱.png — MIT در حال توسعه یک چارچوب آزمایشی برای کمک به تشخیص تصمیمات ناعادلانه هوش مصنوعی است. عکس: Midjourney

هوش مصنوعی به طور فزاینده‌ای برای بهینه‌سازی تصمیمات در زمینه‌های بحرانی به کار گرفته می‌شود. به عنوان مثال، یک سیستم خودران می‌تواند مقرون به صرفه‌ترین طرح توزیع برق را پیشنهاد دهد و در عین حال پایداری ولتاژ را حفظ کند.

با این حال، آیا یک راه حل «از نظر فنی بهینه» واقعاً منصفانه است؟ چه اتفاقی می‌افتد اگر یک استراتژی کم‌هزینه، مناطق کم‌درآمد را نسبت به مناطق ثروتمندتر در برابر قطع برق آسیب‌پذیرتر کند؟

برای کمک به ذینفعان در شناسایی زودهنگام ریسک‌های اخلاقی قبل از اجرا، تیم تحقیقاتی MIT یک روش ارزیابی خودکار توسعه داده است که شاخص‌های کمی (مانند هزینه و قابلیت اطمینان) را با مقادیر کیفی (مانند انصاف) متعادل می‌کند.

این سیستم، ارزیابی عینی را از ارزش‌های انسانی تعریف‌شده توسط کاربر جدا می‌کند و از یک مدل زبان بزرگ (LLM) به عنوان «نماینده» انسانی برای ثبت و ادغام اولویت‌های ذینفعان استفاده می‌کند.

چارچوب ارزیابی تطبیقی، مهم‌ترین سناریوها را برای تحلیل بیشتر انتخاب می‌کند و فرآیندی را که در صورت انجام دستی پرهزینه و زمان‌بر خواهد بود، ساده می‌کند. این سناریوها می‌توانند نشان دهند که چه زمانی یک سیستم هوش مصنوعی با ارزش‌های انسانی همسو می‌شود و همچنین چه زمانی معیارهای اخلاقی را برآورده نمی‌کند.

به گفته چوچو فن (MIT)، صرفاً تعیین قوانین یا «موانع ایمنی» برای هوش مصنوعی کافی نیست، زیرا این قوانین فقط از خطراتی که انسان‌ها می‌توانند پیش‌بینی کنند، جلوگیری می‌کنند. بنابراین، یک رویکرد سیستماتیک برای شناسایی «خطرات ناشناخته» قبل از ایجاد عواقب لازم است.

ارزیابی اخلاقی در سیستم‌های پیچیده

در سیستم‌های بزرگی مانند شبکه‌های برق، ارزیابی مناسب بودن اخلاقی پیشنهادهای تولید شده توسط هوش مصنوعی چالش برانگیز است، به خصوص زمانی که چندین هدف باید به طور همزمان در نظر گرفته شوند.

روش‌های فعلی اغلب به داده‌های در دسترس متکی هستند، اما داده‌هایی که بر اساس معیارهای اخلاقی برچسب‌گذاری شده باشند، نادر هستند. در عین حال، ارزش‌های اخلاقی و سیستم‌های هوش مصنوعی دائماً در حال تغییر هستند و به سرعت روش‌های ارزیابی استاتیک را منسوخ می‌کنند.

تیم تحقیقاتی یک چارچوب طراحی آزمایش به نام SEED-SET توسعه داد که از دو بخش تشکیل شده است:

- مدل عینی: عملکرد را بر اساس شاخص‌های قابل اندازه‌گیری (مانند هزینه‌ها) ارزیابی می‌کند.
- مدل ذهنی: منعکس کننده قضاوت انسانی (مانند احساس انصاف)
این رویکرد امکان شناسایی سناریوهایی را فراهم می‌کند که هم معیارهای فنی و هم ارزش‌های انسانی را برآورده می‌کنند، یا برعکس.

به طور خاص، SEED-SET نیازی به داده‌های ارزیابی از پیش موجود ندارد و می‌تواند با طیف وسیعی از اهداف سازگار شود. به عنوان مثال، در یک سیستم برق، گروه‌های مختلف کاربر (مانند جوامع روستایی و مراکز داده) ممکن است اولویت‌های اخلاقی متفاوتی داشته باشند، علیرغم اینکه هر دو خواهان برق مقرون به صرفه و پایدار هستند.

مدل‌سازی عوامل ذهنی

برای ارزیابی عوامل ذهنی، سیستم از LLM به عنوان نماینده ارزیاب استفاده می‌کند. ترجیحات هر گروه به صورت عبارات زبان طبیعی کدگذاری می‌شوند.

LLM سناریوها را مقایسه کرده و بر اساس معیارهای اخلاقی، گزینه مناسب‌تر را انتخاب می‌کند. این رویکرد به جلوگیری از خستگی و ناهماهنگی انسانی هنگام ارزیابی صدها یا هزاران سناریو کمک می‌کند.

سپس SEED-SET از سناریوهای انتخاب‌شده برای شبیه‌سازی سیستم (مثلاً استراتژی توزیع برق) استفاده می‌کند و به جستجوی سناریوهای جدید با ارزش ارزیابی بالاتر ادامه می‌دهد.

نتیجه نهایی مجموعه‌ای از سناریوهای معمول است که به کاربران امکان می‌دهد عملکرد سیستم هوش مصنوعی را تجزیه و تحلیل کرده و استراتژی خود را در صورت نیاز تنظیم کنند.

برای مثال، این سیستم می‌تواند مواردی را تشخیص دهد که در آن‌ها توزیع برق در ساعات اوج مصرف، مناطق پردرآمد را در اولویت قرار می‌دهد و مناطق محروم را در برابر قطع برق آسیب‌پذیرتر می‌کند.

اثربخشی و توسعه آینده

وقتی SEED-SET روی سیستم‌های دنیای واقعی مانند شبکه‌های هوشمند یا مدیریت ترافیک شهری آزمایش می‌شود، دو برابر روش‌های سنتی سناریوهای بهینه تولید می‌کند، ضمن اینکه موقعیت‌های بیشتری را که سایر روش‌ها از دست می‌دهند نیز تشخیص می‌دهد.

نکته قابل توجه این است که وقتی ترجیحات کاربر تغییر می‌کند، سناریوهای تولید شده توسط سیستم نیز به طور قابل توجهی تغییر می‌کنند که نشان‌دهنده درجه بالایی از سازگاری با ارزش‌های انسانی است.

در آینده، تیم تحقیقاتی قصد دارد مطالعاتی را با کاربران واقعی انجام دهد تا سودمندی سیستم را در فرآیند تصمیم‌گیری ارزیابی کند. همزمان، آنها قصد دارند این روش را به مسائل پیچیده‌تر، مانند ارزیابی تصمیمات مدل‌های زبانی بزرگتر، گسترش دهند.

بخشی از بودجه این تحقیق توسط آژانس پروژه‌های تحقیقاتی پیشرفته دفاعی ایالات متحده (DARPA) تأمین شده است.

(طبق اخبار MIT)

منبع: https://vietnamnet.vn/danh-gia-dao-duc-cua-cac-he-thong-tu-hanh-2508477.html