
هوش مصنوعی به طور فزایندهای برای بهینهسازی تصمیمات در زمینههای بحرانی به کار گرفته میشود. به عنوان مثال، یک سیستم خودران میتواند مقرون به صرفهترین طرح توزیع برق را پیشنهاد دهد و در عین حال پایداری ولتاژ را حفظ کند.
با این حال، آیا یک راه حل «از نظر فنی بهینه» واقعاً منصفانه است؟ چه اتفاقی میافتد اگر یک استراتژی کمهزینه، مناطق کمدرآمد را نسبت به مناطق ثروتمندتر در برابر قطع برق آسیبپذیرتر کند؟
برای کمک به ذینفعان در شناسایی زودهنگام ریسکهای اخلاقی قبل از اجرا، تیم تحقیقاتی MIT یک روش ارزیابی خودکار توسعه داده است که شاخصهای کمی (مانند هزینه و قابلیت اطمینان) را با مقادیر کیفی (مانند انصاف) متعادل میکند.
این سیستم، ارزیابی عینی را از ارزشهای انسانی تعریفشده توسط کاربر جدا میکند و از یک مدل زبان بزرگ (LLM) به عنوان «نماینده» انسانی برای ثبت و ادغام اولویتهای ذینفعان استفاده میکند.
چارچوب ارزیابی تطبیقی، مهمترین سناریوها را برای تحلیل بیشتر انتخاب میکند و فرآیندی را که در صورت انجام دستی پرهزینه و زمانبر خواهد بود، ساده میکند. این سناریوها میتوانند نشان دهند که چه زمانی یک سیستم هوش مصنوعی با ارزشهای انسانی همسو میشود و همچنین چه زمانی معیارهای اخلاقی را برآورده نمیکند.
به گفته چوچو فن (MIT)، صرفاً تعیین قوانین یا «موانع ایمنی» برای هوش مصنوعی کافی نیست، زیرا این قوانین فقط از خطراتی که انسانها میتوانند پیشبینی کنند، جلوگیری میکنند. بنابراین، یک رویکرد سیستماتیک برای شناسایی «خطرات ناشناخته» قبل از ایجاد عواقب لازم است.
ارزیابی اخلاقی در سیستمهای پیچیده
در سیستمهای بزرگی مانند شبکههای برق، ارزیابی مناسب بودن اخلاقی پیشنهادهای تولید شده توسط هوش مصنوعی چالش برانگیز است، به خصوص زمانی که چندین هدف باید به طور همزمان در نظر گرفته شوند.
روشهای فعلی اغلب به دادههای در دسترس متکی هستند، اما دادههایی که بر اساس معیارهای اخلاقی برچسبگذاری شده باشند، نادر هستند. در عین حال، ارزشهای اخلاقی و سیستمهای هوش مصنوعی دائماً در حال تغییر هستند و به سرعت روشهای ارزیابی استاتیک را منسوخ میکنند.
تیم تحقیقاتی یک چارچوب طراحی آزمایش به نام SEED-SET توسعه داد که از دو بخش تشکیل شده است:
- مدل عینی: عملکرد را بر اساس شاخصهای قابل اندازهگیری (مانند هزینهها) ارزیابی میکند.
- مدل ذهنی: منعکس کننده قضاوت انسانی (مانند احساس انصاف)
این رویکرد امکان شناسایی سناریوهایی را فراهم میکند که هم معیارهای فنی و هم ارزشهای انسانی را برآورده میکنند، یا برعکس.
به طور خاص، SEED-SET نیازی به دادههای ارزیابی از پیش موجود ندارد و میتواند با طیف وسیعی از اهداف سازگار شود. به عنوان مثال، در یک سیستم برق، گروههای مختلف کاربر (مانند جوامع روستایی و مراکز داده) ممکن است اولویتهای اخلاقی متفاوتی داشته باشند، علیرغم اینکه هر دو خواهان برق مقرون به صرفه و پایدار هستند.
مدلسازی عوامل ذهنی
برای ارزیابی عوامل ذهنی، سیستم از LLM به عنوان نماینده ارزیاب استفاده میکند. ترجیحات هر گروه به صورت عبارات زبان طبیعی کدگذاری میشوند.
LLM سناریوها را مقایسه کرده و بر اساس معیارهای اخلاقی، گزینه مناسبتر را انتخاب میکند. این رویکرد به جلوگیری از خستگی و ناهماهنگی انسانی هنگام ارزیابی صدها یا هزاران سناریو کمک میکند.
سپس SEED-SET از سناریوهای انتخابشده برای شبیهسازی سیستم (مثلاً استراتژی توزیع برق) استفاده میکند و به جستجوی سناریوهای جدید با ارزش ارزیابی بالاتر ادامه میدهد.
نتیجه نهایی مجموعهای از سناریوهای معمول است که به کاربران امکان میدهد عملکرد سیستم هوش مصنوعی را تجزیه و تحلیل کرده و استراتژی خود را در صورت نیاز تنظیم کنند.
برای مثال، این سیستم میتواند مواردی را تشخیص دهد که در آنها توزیع برق در ساعات اوج مصرف، مناطق پردرآمد را در اولویت قرار میدهد و مناطق محروم را در برابر قطع برق آسیبپذیرتر میکند.
اثربخشی و توسعه آینده
وقتی SEED-SET روی سیستمهای دنیای واقعی مانند شبکههای هوشمند یا مدیریت ترافیک شهری آزمایش میشود، دو برابر روشهای سنتی سناریوهای بهینه تولید میکند، ضمن اینکه موقعیتهای بیشتری را که سایر روشها از دست میدهند نیز تشخیص میدهد.
نکته قابل توجه این است که وقتی ترجیحات کاربر تغییر میکند، سناریوهای تولید شده توسط سیستم نیز به طور قابل توجهی تغییر میکنند که نشاندهنده درجه بالایی از سازگاری با ارزشهای انسانی است.
در آینده، تیم تحقیقاتی قصد دارد مطالعاتی را با کاربران واقعی انجام دهد تا سودمندی سیستم را در فرآیند تصمیمگیری ارزیابی کند. همزمان، آنها قصد دارند این روش را به مسائل پیچیدهتر، مانند ارزیابی تصمیمات مدلهای زبانی بزرگتر، گسترش دهند.
بخشی از بودجه این تحقیق توسط آژانس پروژههای تحقیقاتی پیشرفته دفاعی ایالات متحده (DARPA) تأمین شده است.
(طبق اخبار MIT)
منبع: https://vietnamnet.vn/danh-gia-dao-duc-cua-cac-he-thong-tu-hanh-2508477.html











نظر (0)