Ocena etyczna systemów autonomicznych

Naukowcy z MIT opracowali ramy testowe, które pomogą zidentyfikować sytuacje, w których systemy wspomagania decyzji przez sztuczną inteligencję nie są w stanie zapewnić sprawiedliwego traktowania jednostek i społeczności.

VietNamNet•23/04/2026

Obraz do lekcji 31.png — MIT opracowuje ramy testowe, które pomogą wykryć nieuczciwe decyzje podejmowane przez sztuczną inteligencję. Zdjęcie: Midjourney

Sztuczna inteligencja jest coraz częściej wykorzystywana do optymalizacji decyzji w krytycznych sytuacjach. Na przykład, system autonomiczny może zaproponować najbardziej opłacalny plan dystrybucji energii, zachowując jednocześnie stabilność napięcia.

Czy jednak „technicznie optymalne” rozwiązanie jest rzeczywiście sprawiedliwe? Co się stanie, jeśli strategia niskich kosztów sprawi, że obszary o niskich dochodach będą bardziej narażone na przerwy w dostawie prądu niż obszary zamożniejsze?

Aby pomóc interesariuszom wykryć ryzyko etyczne na wczesnym etapie, jeszcze przed wdrożeniem, zespół badawczy MIT opracował zautomatyzowaną metodę oceny, która równoważy wskaźniki ilościowe (takie jak koszt i niezawodność) z wartościami jakościowymi (takimi jak uczciwość).

System ten oddziela obiektywną ocenę od zdefiniowanych przez użytkownika wartości ludzkich i wykorzystuje model dużego języka (LLM) jako „reprezentanta” człowieka do rejestrowania i integrowania priorytetów interesariuszy.

Adaptacyjne ramy ewaluacyjne wybiorą najważniejsze scenariusze do dalszej analizy, upraszczając proces, który byłby kosztowny i czasochłonny, gdyby był przeprowadzany ręcznie. Scenariusze te mogą wskazywać, kiedy system AI jest zgodny z wartościami ludzkimi, a kiedy nie spełnia kryteriów etycznych.

Według Chuchu Fana (MIT), samo ustalanie reguł lub „barier bezpieczeństwa” dla sztucznej inteligencji jest niewystarczające, ponieważ zapobiegają one jedynie zagrożeniom, które ludzie są w stanie przewidzieć. Dlatego potrzebne jest systematyczne podejście do wykrywania „nieznanych zagrożeń”, zanim spowodują one konsekwencje.

Ocena etyczna w systemach złożonych

W przypadku dużych systemów, takich jak sieci energetyczne, ocena etycznej zasadności propozycji generowanych przez sztuczną inteligencję jest trudna, zwłaszcza gdy konieczne jest jednoczesne uwzględnienie wielu celów.

Obecne metody często opierają się na łatwo dostępnych danych, ale dane oznaczone zgodnie z kryteriami etycznymi są rzadkością. Jednocześnie wartości etyczne i systemy sztucznej inteligencji stale się zmieniają, co szybko sprawia, że statyczne metody oceny stają się przestarzałe.

Zespół badawczy opracował eksperymentalny model projektowy o nazwie SEED-SET, który składa się z dwóch części:

- Model obiektywny: ocenia wydajność na podstawie mierzalnych wskaźników (takich jak koszty)
- Model subiektywny: odzwierciedla ludzki osąd (taki jak poczucie sprawiedliwości)
Podejście to pozwala na identyfikację scenariuszy spełniających zarówno kryteria techniczne, jak i wartości ludzkie, lub odwrotnie.

W szczególności SEED-SET nie wymaga istniejących danych ewaluacyjnych i może być dostosowany do szerokiego zakresu celów. Na przykład, w systemie elektroenergetycznym różne grupy użytkowników (takie jak społeczności wiejskie i centra danych) mogą mieć różne priorytety etyczne, mimo że obie pragną niedrogiej i stabilnej energii elektrycznej.

Modelowanie czynników subiektywnych

Do oceny czynników subiektywnych system wykorzystuje LLM jako reprezentację oceniającego. Preferencje każdej grupy są kodowane w postaci stwierdzeń w języku naturalnym.

LLM porówna scenariusze i wybierze bardziej odpowiednią opcję w oparciu o kryteria etyczne. Takie podejście pomaga uniknąć zmęczenia i niespójności podczas oceny setek lub tysięcy scenariuszy.

Następnie SEED-SET wykorzystuje wybrane scenariusze do symulacji systemu (np. strategii dystrybucji energii) i kontynuuje wyszukiwanie nowych scenariuszy o wyższej wartości oceny.

Efektem końcowym jest zestaw typowych scenariuszy, umożliwiający użytkownikom analizę działania systemu AI i dostosowanie strategii w razie potrzeby.

System mógłby na przykład wykrywać sytuacje, w których dystrybucja energii elektrycznej w godzinach szczytu priorytetowo traktuje obszary o wysokich dochodach, przez co obszary o niekorzystnych warunkach gospodarowania są bardziej narażone na przerwy w dostawie prądu.

Skuteczność i przyszły rozwój

Testy przeprowadzone w rzeczywistych systemach, takich jak inteligentne sieci czy systemy zarządzania ruchem miejskim, wykazały, że SEED-SET generuje dwukrotnie więcej optymalnych scenariuszy niż tradycyjne metody, a także wykrywa więcej sytuacji pomijanych przez inne metody.

Warto zauważyć, że gdy zmieniają się preferencje użytkownika, scenariusze generowane przez system również ulegają znaczącym zmianom, co dowodzi wysokiego stopnia dostosowania się do ludzkich wartości.

W przyszłości zespół badawczy planuje przeprowadzić badania z udziałem rzeczywistych użytkowników, aby ocenić przydatność systemu w procesie podejmowania decyzji. Jednocześnie zespół dąży do rozszerzenia metodologii o bardziej złożone problemy, takie jak ocena decyzji w ramach większych modeli językowych.

Badania te były częściowo finansowane przez Agencję Zaawansowanych Projektów Badawczych w Dziedzinie Obronności Stanów Zjednoczonych (DARPA).

(Według MIT News)

Źródło: https://vietnamnet.vn/danh-gia-dao-duc-cua-cac-he-thong-tu-hanh-2508477.html