Етична оцінка автономних систем

Дослідники Массачусетського технологічного інституту розробили систему тестування, яка допомагає виявляти ситуації, коли системи підтримки прийняття рішень на основі штучного інтелекту не забезпечують справедливості для окремих осіб та громад.

VietNamNet•23/04/2026

Зображення для уроку 31.png — Массачусетський технологічний інститут розробляє систему тестування, яка допоможе виявляти несправедливі рішення, що приймаються штучним інтелектом. Фото: Midjourney

Штучний інтелект все частіше застосовується для оптимізації рішень у критичних ситуаціях. Наприклад, автономна система може запропонувати найефективніший з точки зору витрат план розподілу електроенергії, зберігаючи при цьому стабільність напруги.

Однак, чи справді справедливим є «технічно оптимальне» рішення? Що станеться, якщо низьковитратна стратегія зробить райони з низьким рівнем доходу більш вразливими до відключень електроенергії, ніж багатші райони?

Щоб допомогти зацікавленим сторонам виявляти етичні ризики на ранніх стадіях до впровадження, дослідницька група MIT розробила автоматизований метод оцінки, який збалансовує кількісні показники (такі як вартість та надійність) з якісними цінностями (такими як справедливість).

Ця система відокремлює об'єктивну оцінку від визначених користувачем людських цінностей та використовує модель великої мови (LLM) як людського «представника» для запису та інтеграції пріоритетів зацікавлених сторін.

Адаптивна система оцінювання вибере найважливіші сценарії для подальшого аналізу, спрощуючи процес, який був би дорогим і трудомістким, якби його виконували вручну. Ці сценарії можуть вказувати на те, коли система штучного інтелекту відповідає людським цінностям, а також коли вона не відповідає етичним критеріям.

За словами Чучу Фана (MIT), простого встановлення правил або «бар’єрів безпеки» для ШІ недостатньо, оскільки вони лише запобігають ризикам, які люди можуть передбачити. Тому потрібен систематичний підхід для виявлення «невідомих ризиків», перш ніж вони спричинять наслідки.

Етична оцінка у складних системах

У великих системах, таких як енергетичні мережі, оцінка етичної доцільності пропозицій, створених штучним інтелектом, є складною, особливо коли необхідно одночасно враховувати кілька цілей.

Сучасні методи часто спираються на легкодоступні дані, але дані, марковані відповідно до етичних критеріїв, трапляються рідко. Водночас етичні цінності та системи штучного інтелекту постійно змінюються, що швидко робить статичні методи оцінювання застарілими.

Дослідницька група розробила експериментальну структуру дизайну під назвою SEED-SET, яка складається з двох частин:

- Об'єктивна модель: оцінює ефективність на основі вимірюваних показників (таких як витрати)
- Суб'єктивна модель: відображає людське судження (наприклад, почуття справедливості)
Такий підхід дозволяє ідентифікувати сценарії, які відповідають як технічним критеріям, так і людським цінностям, або навпаки.

Зокрема, SEED-SET не вимагає попередньо існуючих даних оцінки та може адаптуватися до широкого кола цілей. Наприклад, в електроенергетичній системі різні групи користувачів (такі як сільські громади та центри обробки даних) можуть мати різні етичні пріоритети, незважаючи на те, що обидві групи бажають доступної та стабільної електроенергії.

Моделювання суб'єктивних факторів

Для оцінки суб'єктивних факторів система використовує LLM як представника оцінювача. Уподобання кожної групи закодовані в твердження природною мовою.

LLM порівнюватиме сценарії та вибиратиме більш підходящий варіант на основі етичних критеріїв. Такий підхід допомагає уникнути людської втоми та непослідовності під час оцінки сотень або тисяч сценаріїв.

Потім SEED-SET використовує вибрані сценарії для моделювання системи (наприклад, стратегії розподілу електроенергії) та продовжує пошук нових сценаріїв з вищим оціночним значенням.

Кінцевим результатом є набір типових сценаріїв, що дозволяє користувачам аналізувати продуктивність системи штучного інтелекту та коригувати свою стратегію за потреби.

Наприклад, система може виявляти випадки, коли розподіл електроенергії надає пріоритет районам з високим рівнем доходу в години пік, що робить неблагополучні райони більш вразливими до відключень електроенергії.

Ефективність та майбутній розвиток

Під час тестування на реальних системах, таких як інтелектуальні мережі або управління міським дорожнім рухом, SEED-SET генерує вдвічі більше оптимальних сценаріїв, ніж традиційні методи, а також виявляє більше ситуацій, які інші методи пропускають.

Примітно, що коли змінюються вподобання користувачів, сценарії, що генеруються системою, також суттєво змінюються, демонструючи високий ступінь адаптивності до людських цінностей.

У майбутньому дослідницька група планує провести дослідження з реальними користувачами, щоб оцінити корисність системи в процесі прийняття рішень. Одночасно вони прагнуть розширити методологію на складніші проблеми, такі як оцінка рішень більших мовних моделей.

Це дослідження частково фінансувалося Агентством передових дослідницьких проектів Міністерства оборони США (DARPA).

(За даними новин MIT)

Джерело: https://vietnamnet.vn/danh-gia-dao-duc-cua-cac-he-thong-tu-hanh-2508477.html