Obraz do lekcji 31.png
MIT opracowuje ramy testowe, które pomogą wykryć nieuczciwe decyzje podejmowane przez sztuczną inteligencję. Zdjęcie: Midjourney

Sztuczna inteligencja jest coraz częściej wykorzystywana do optymalizacji decyzji w krytycznych sytuacjach. Na przykład, system autonomiczny może zaproponować najbardziej opłacalny plan dystrybucji energii, zachowując jednocześnie stabilność napięcia.

Czy jednak „technicznie optymalne” rozwiązanie jest rzeczywiście sprawiedliwe? Co się stanie, jeśli strategia niskich kosztów sprawi, że obszary o niskich dochodach będą bardziej narażone na przerwy w dostawie prądu niż obszary zamożniejsze?

Aby pomóc interesariuszom wykryć ryzyko etyczne na wczesnym etapie, jeszcze przed wdrożeniem, zespół badawczy MIT opracował zautomatyzowaną metodę oceny, która równoważy wskaźniki ilościowe (takie jak koszt i niezawodność) z wartościami jakościowymi (takimi jak uczciwość).

System ten oddziela obiektywną ocenę od zdefiniowanych przez użytkownika wartości ludzkich i wykorzystuje model dużego języka (LLM) jako „reprezentanta” człowieka do rejestrowania i integrowania priorytetów interesariuszy.

Adaptacyjne ramy ewaluacyjne wybiorą najważniejsze scenariusze do dalszej analizy, upraszczając proces, który byłby kosztowny i czasochłonny, gdyby był przeprowadzany ręcznie. Scenariusze te mogą wskazywać, kiedy system AI jest zgodny z wartościami ludzkimi, a kiedy nie spełnia kryteriów etycznych.

Według Chuchu Fana (MIT), samo ustalanie reguł lub „barier bezpieczeństwa” dla sztucznej inteligencji jest niewystarczające, ponieważ zapobiegają one jedynie zagrożeniom, które ludzie są w stanie przewidzieć. Dlatego potrzebne jest systematyczne podejście do wykrywania „nieznanych zagrożeń”, zanim spowodują one konsekwencje.

Ocena etyczna w systemach złożonych

W przypadku dużych systemów, takich jak sieci energetyczne, ocena etycznej zasadności propozycji generowanych przez sztuczną inteligencję jest trudna, zwłaszcza gdy konieczne jest jednoczesne uwzględnienie wielu celów.