תמונה לשיעור 31.png
MIT מפתחת מסגרת בדיקות שתסייע בזיהוי בינה מלאכותית שמקבלת החלטות לא הוגנות. צילום: Midjourney

בינה מלאכותית מיושמת יותר ויותר כדי לייעל החלטות בהקשרים קריטיים. לדוגמה, מערכת אוטונומית יכולה להציע את תוכנית חלוקת החשמל היעילה ביותר מבחינת עלות תוך שמירה על יציבות מתח.

עם זאת, האם פתרון "אופטימלי מבחינה טכנית" באמת הוגן? מה קורה אם אסטרטגיה בעלות נמוכה הופכת אזורים בעלי הכנסה נמוכה לפגיעים יותר להפסקות חשמל מאשר אזורים עשירים יותר?

כדי לסייע לבעלי עניין לזהות סיכונים אתיים מוקדם לפני היישום, צוות המחקר של MIT פיתח שיטת הערכה אוטומטית המאזנת בין אינדיקטורים כמותיים (כגון עלות ואמינות) לבין ערכים איכותיים (כגון הוגנות).

מערכת זו מפרידה בין הערכה אובייקטיבית לבין ערכים אנושיים המוגדרים על ידי המשתמש, ומשתמשת במודל שפה גדול (LLM) כ"נציג" אנושי כדי לתעד ולשלב את סדרי העדיפויות של בעלי העניין.

מסגרת ההערכה האדפטיבית תבחר את התרחישים החשובים ביותר לניתוח נוסף, ותפשט תהליך שיהיה יקר וגוזל זמן אם יבוצע באופן ידני. תרחישים אלה יכולים להצביע על מתי מערכת בינה מלאכותית מתיישבת עם ערכים אנושיים, כמו גם מתי היא אינה עומדת בקריטריונים אתיים.

לפי צ'וצ'ו פאן (MIT), קביעת כללים או "מחסומי בטיחות" עבור בינה מלאכותית אינה מספיקה, שכן אלה מונעים רק סיכונים שבני אדם יכולים לצפות. לכן, יש צורך בגישה שיטתית כדי לזהות "סיכונים לא ידועים" לפני שהם גורמים לתוצאות.

הערכה אתית במערכות מורכבות

במערכות גדולות כמו רשתות חשמל, הערכת ההלימות האתית של הצעות שנוצרו על ידי בינה מלאכותית היא מאתגרת, במיוחד כאשר יש לשקול מספר מטרות בו זמנית.