הערכה אתית של מערכות אוטונומיות

חוקרי MIT פיתחו מסגרת בדיקות שתסייע בזיהוי מצבים שבהם מערכות תמיכה בקבלת החלטות מבוססות בינה מלאכותית נכשלות בהבטחת הוגנות עבור יחידים וקהילות.

VietNamNet•23/04/2026

תמונה לשיעור 31.png — MIT מפתחת מסגרת בדיקות שתסייע בזיהוי בינה מלאכותית שמקבלת החלטות לא הוגנות. צילום: Midjourney

בינה מלאכותית מיושמת יותר ויותר כדי לייעל החלטות בהקשרים קריטיים. לדוגמה, מערכת אוטונומית יכולה להציע את תוכנית חלוקת החשמל היעילה ביותר מבחינת עלות תוך שמירה על יציבות מתח.

עם זאת, האם פתרון "אופטימלי מבחינה טכנית" באמת הוגן? מה קורה אם אסטרטגיה בעלות נמוכה הופכת אזורים בעלי הכנסה נמוכה לפגיעים יותר להפסקות חשמל מאשר אזורים עשירים יותר?

כדי לסייע לבעלי עניין לזהות סיכונים אתיים מוקדם לפני היישום, צוות המחקר של MIT פיתח שיטת הערכה אוטומטית המאזנת בין אינדיקטורים כמותיים (כגון עלות ואמינות) לבין ערכים איכותיים (כגון הוגנות).

מערכת זו מפרידה בין הערכה אובייקטיבית לבין ערכים אנושיים המוגדרים על ידי המשתמש, ומשתמשת במודל שפה גדול (LLM) כ"נציג" אנושי כדי לתעד ולשלב את סדרי העדיפויות של בעלי העניין.

מסגרת ההערכה האדפטיבית תבחר את התרחישים החשובים ביותר לניתוח נוסף, ותפשט תהליך שיהיה יקר וגוזל זמן אם יבוצע באופן ידני. תרחישים אלה יכולים להצביע על מתי מערכת בינה מלאכותית מתיישבת עם ערכים אנושיים, כמו גם מתי היא אינה עומדת בקריטריונים אתיים.

לפי צ'וצ'ו פאן (MIT), קביעת כללים או "מחסומי בטיחות" עבור בינה מלאכותית אינה מספיקה, שכן אלה מונעים רק סיכונים שבני אדם יכולים לצפות. לכן, יש צורך בגישה שיטתית כדי לזהות "סיכונים לא ידועים" לפני שהם גורמים לתוצאות.

הערכה אתית במערכות מורכבות

במערכות גדולות כמו רשתות חשמל, הערכת ההלימות האתית של הצעות שנוצרו על ידי בינה מלאכותית היא מאתגרת, במיוחד כאשר יש לשקול מספר מטרות בו זמנית.

השיטות הנוכחיות מסתמכות לעתים קרובות על נתונים זמינים, אך נתונים המסומנים לפי קריטריונים אתיים הם נדירים. במקביל, ערכים אתיים ומערכות בינה מלאכותית משתנים כל הזמן, מה שהופך במהירות שיטות הערכה סטטיות למיושנות.

צוות המחקר פיתח מסגרת עיצוב ניסיונית בשם SEED-SET, המורכבת משני חלקים:

- מודל אובייקטיבי: מעריך ביצועים על סמך אינדיקטורים מדידים (כגון עלויות)
- מודל סובייקטיבי: משקף שיפוט אנושי (כגון תחושות של הגינות)
גישה זו מאפשרת זיהוי תרחישים העומדים הן בקריטריונים טכניים והן בערכים אנושיים, או להיפך.

בפרט, SEED-SET אינו דורש נתוני הערכה קיימים מראש ויכול להסתגל למגוון רחב של מטרות. לדוגמה, במערכת חשמל, קבוצות משתמשים שונות (כגון קהילות כפריות ומרכזי נתונים) עשויות להיות בעלות סדרי עדיפויות אתיים שונים למרות ששניהם רוצים חשמל במחיר סביר ויציב.

מידול גורמים סובייקטיביים

כדי להעריך גורמים סובייקטיביים, המערכת משתמשת ב-LLM כנציג של המעריך. ההעדפות של כל קבוצה מקודדות להצהרות בשפה טבעית.

תואר שני במשפטים (LLM) ישווה תרחישים ויבחר באפשרות המתאימה יותר על סמך קריטריונים אתיים. גישה זו מסייעת למנוע עייפות אנושית וחוסר עקביות בעת הערכת מאות או אלפי תרחישים.

לאחר מכן, SEED-SET משתמש בתרחישים שנבחרו כדי לדמות את המערכת (למשל, אסטרטגיית חלוקת חשמל) וממשיך לחפש תרחישים חדשים בעלי ערך הערכה גבוה יותר.

התוצאה הסופית היא אוסף של תרחישים אופייניים, המאפשרים למשתמשים לנתח את ביצועי מערכת הבינה המלאכותית ולהתאים את האסטרטגיה שלהם לפי הצורך.

לדוגמה, המערכת תוכל לזהות מקרים בהם חלוקת החשמל נותנת עדיפות לאזורים בעלי הכנסה גבוהה בשעות השיא, מה שהופך אזורים מוחלשים לפגיעים יותר להפסקות חשמל.

יעילות ופיתוח עתידי

כאשר SEED-SET נבדק על מערכות אמיתיות כמו רשתות חכמות או ניהול תנועה עירוני, הוא מייצר פי שניים תרחישים אופטימליים בהשוואה לשיטות מסורתיות, תוך שהוא מזהה גם יותר מצבים ששיטות אחרות מפספסות.

ראוי לציין שכאשר העדפות המשתמש משתנות, גם התרחישים שנוצרים על ידי המערכת משתנים באופן משמעותי, דבר המדגים רמה גבוהה של יכולת הסתגלות לערכים אנושיים.

בעתיד, צוות המחקר מתכנן לערוך מחקרים עם משתמשים אמיתיים כדי להעריך את התועלת של המערכת בתהליך קבלת ההחלטות. במקביל, הם שואפים להרחיב את המתודולוגיה לבעיות מורכבות יותר, כגון הערכת ההחלטות של מודלים של שפה גדולים יותר.

מחקר זה מומן בחלקו על ידי הסוכנות האמריקאית לפרויקטים למחקר מתקדמים (DARPA).

(על פי MIT News)

מקור: https://vietnamnet.vn/danh-gia-dao-duc-cua-cac-he-thong-tu-hanh-2508477.html