Изображение для урока 31.png
MIT разрабатывает систему тестирования, которая поможет выявлять несправедливые решения, принимаемые искусственным интеллектом. Фото: Midjourney

Искусственный интеллект все чаще применяется для оптимизации решений в критически важных ситуациях. Например, автономная система может предложить наиболее экономически эффективный план распределения электроэнергии, сохраняя при этом стабильность напряжения.

Однако, действительно ли «технически оптимальное» решение справедливо? Что произойдет, если стратегия с низкими затратами сделает районы с низким уровнем дохода более уязвимыми к отключениям электроэнергии, чем более богатые районы?

Чтобы помочь заинтересованным сторонам выявлять этические риски на ранних стадиях, до начала внедрения, исследовательская группа MIT разработала автоматизированный метод оценки, который уравновешивает количественные показатели (такие как стоимость и надежность) с качественными ценностями (такими как справедливость).

Эта система отделяет объективную оценку от определяемых пользователем человеческих ценностей и использует большую языковую модель (LLM) в качестве человеческого «представителя» для регистрации и интеграции приоритетов заинтересованных сторон.

Адаптивная система оценки выберет наиболее важные сценарии для дальнейшего анализа, упростив процесс, который был бы дорогостоящим и трудоемким при ручном выполнении. Эти сценарии могут указывать на то, соответствует ли система ИИ человеческим ценностям, а также на то, когда она не соответствует этическим критериям.

По мнению Чучу Фана (MIT), простое установление правил или «барьеров безопасности» для ИИ недостаточно, поскольку они предотвращают только те риски, которые человек может предвидеть. Поэтому необходим систематический подход для выявления «неизвестных рисков» до того, как они приведут к последствиям.

Этическая оценка в сложных системах

В крупных системах, таких как электросети, оценка этической целесообразности предложений, сгенерированных искусственным интеллектом, представляет собой сложную задачу, особенно когда необходимо одновременно учитывать множество целей.