Зображення для уроку 31.png
Массачусетський технологічний інститут розробляє систему тестування, яка допоможе виявляти несправедливі рішення, що приймаються штучним інтелектом. Фото: Midjourney

Штучний інтелект все частіше застосовується для оптимізації рішень у критичних ситуаціях. Наприклад, автономна система може запропонувати найефективніший з точки зору витрат план розподілу електроенергії, зберігаючи при цьому стабільність напруги.

Однак, чи справді справедливим є «технічно оптимальне» рішення? Що станеться, якщо низьковитратна стратегія зробить райони з низьким рівнем доходу більш вразливими до відключень електроенергії, ніж багатші райони?

Щоб допомогти зацікавленим сторонам виявляти етичні ризики на ранніх стадіях до впровадження, дослідницька група MIT розробила автоматизований метод оцінки, який збалансовує кількісні показники (такі як вартість та надійність) з якісними цінностями (такими як справедливість).

Ця система відокремлює об'єктивну оцінку від визначених користувачем людських цінностей та використовує модель великої мови (LLM) як людського «представника» для запису та інтеграції пріоритетів зацікавлених сторін.

Адаптивна система оцінювання вибере найважливіші сценарії для подальшого аналізу, спрощуючи процес, який був би дорогим і трудомістким, якби його виконували вручну. Ці сценарії можуть вказувати на те, коли система штучного інтелекту відповідає людським цінностям, а також коли вона не відповідає етичним критеріям.

За словами Чучу Фана (MIT), простого встановлення правил або «бар’єрів безпеки» для ШІ недостатньо, оскільки вони лише запобігають ризикам, які люди можуть передбачити. Тому потрібен систематичний підхід для виявлення «невідомих ризиків», перш ніж вони спричинять наслідки.

Етична оцінка у складних системах

У великих системах, таких як енергетичні мережі, оцінка етичної доцільності пропозицій, створених штучним інтелектом, є складною, особливо коли необхідно одночасно враховувати кілька цілей.