Ethische beoordeling van autonome systemen

Onderzoekers van MIT hebben een testkader ontwikkeld om situaties te identificeren waarin AI-systemen voor besluitvormingsondersteuning er niet in slagen om eerlijkheid voor individuen en gemeenschappen te garanderen.

VietNamNet•23/04/2026

Afbeelding voor les 31.png — MIT ontwikkelt een testframework om te helpen detecteren of AI oneerlijke beslissingen neemt. Foto: Midjourney

Kunstmatige intelligentie wordt steeds vaker ingezet om beslissingen in kritieke situaties te optimaliseren. Zo kan een autonoom systeem bijvoorbeeld het meest kostenefficiënte stroomdistributieplan voorstellen, terwijl de spanningsstabiliteit behouden blijft.

Is een "technisch optimale" oplossing echter wel echt eerlijk? Wat gebeurt er als een goedkope strategie ervoor zorgt dat achterstandsgebieden kwetsbaarder zijn voor stroomuitval dan rijkere gebieden?

Om belanghebbenden te helpen ethische risico's vroegtijdig te detecteren, vóór de implementatie, heeft het MIT-onderzoeksteam een geautomatiseerde beoordelingsmethode ontwikkeld die kwantitatieve indicatoren (zoals kosten en betrouwbaarheid) afweegt tegen kwalitatieve waarden (zoals rechtvaardigheid).

Dit systeem scheidt objectieve evaluatie van door de gebruiker gedefinieerde menselijke waarden en gebruikt een groot taalmodel (LLM) als een menselijke "vertegenwoordiger" om de prioriteiten van belanghebbenden vast te leggen en te integreren.

Het adaptieve evaluatiekader selecteert de belangrijkste scenario's voor verdere analyse, waardoor een proces dat handmatig kostbaar en tijdrovend zou zijn, wordt vereenvoudigd. Deze scenario's kunnen aangeven wanneer een AI-systeem aansluit bij menselijke waarden, en wanneer het niet voldoet aan ethische criteria.

Volgens Chuchu Fan (MIT) is het simpelweg vaststellen van regels of "veiligheidsbarrières" voor AI onvoldoende, omdat deze alleen risico's voorkomen die mensen kunnen voorzien. Daarom is een systematische aanpak nodig om "onbekende risico's" te detecteren voordat ze gevolgen hebben.

Ethische evaluatie in complexe systemen

In grote systemen zoals elektriciteitsnetten is het beoordelen van de ethische aanvaardbaarheid van door AI gegenereerde voorstellen een uitdaging, vooral wanneer er tegelijkertijd rekening moet worden gehouden met meerdere doelstellingen.

De huidige methoden zijn vaak gebaseerd op gemakkelijk beschikbare gegevens, maar gegevens die volgens ethische criteria zijn gelabeld, zijn zeldzaam. Tegelijkertijd veranderen ethische waarden en AI-systemen voortdurend, waardoor statische evaluatiemethoden snel achterhaald raken.

Het onderzoeksteam ontwikkelde een experimenteel ontwerpkader genaamd SEED-SET, dat uit twee delen bestaat:

- Objectief model: evalueert prestaties op basis van meetbare indicatoren (zoals kosten)
- Subjectief model: weerspiegelt menselijk oordeel (zoals gevoelens van rechtvaardigheid)
Deze aanpak maakt het mogelijk om scenario's te identificeren die zowel aan technische criteria als aan menselijke waarden voldoen, of omgekeerd.

SEED-SET vereist met name geen vooraf bestaande evaluatiegegevens en kan worden aangepast aan een breed scala aan doelstellingen. In een elektriciteitssysteem kunnen bijvoorbeeld verschillende gebruikersgroepen (zoals plattelandsgemeenschappen en datacenters) verschillende ethische prioriteiten hebben, ondanks dat ze allemaal betaalbare en stabiele elektriciteit wensen.

Het modelleren van subjectieve factoren

Om subjectieve factoren te evalueren, gebruikt het systeem LLM als representant van de evaluator. De voorkeuren van elke groep worden gecodeerd in natuurlijke taaluitspraken.

LLM vergelijkt scenario's en selecteert de meest geschikte optie op basis van ethische criteria. Deze aanpak helpt menselijke vermoeidheid en inconsistentie te voorkomen bij het evalueren van honderden of duizenden scenario's.

SEED-SET gebruikt vervolgens de geselecteerde scenario's om het systeem te simuleren (bijvoorbeeld de strategie voor stroomdistributie) en blijft zoeken naar nieuwe scenario's met een hogere evaluatiewaarde.

Het eindresultaat is een reeks typische scenario's, waarmee gebruikers de prestaties van het AI-systeem kunnen analyseren en hun strategie indien nodig kunnen aanpassen.

Het systeem zou bijvoorbeeld gevallen kunnen detecteren waarbij de stroomdistributie tijdens piekuren prioriteit geeft aan gebieden met hoge inkomens, waardoor achtergestelde gebieden kwetsbaarder worden voor stroomuitval.

Effectiviteit en toekomstige ontwikkeling

Bij tests op realistische systemen zoals slimme elektriciteitsnetten of stedelijk verkeersmanagement genereert SEED-SET twee keer zoveel optimale scenario's als traditionele methoden, en detecteert het bovendien meer situaties die andere methoden over het hoofd zien.

Opvallend is dat wanneer de voorkeuren van de gebruiker veranderen, de door het systeem gegenereerde scenario's ook aanzienlijk veranderen, wat een hoge mate van aanpassingsvermogen aan menselijke waarden aantoont.

Het onderzoeksteam is van plan om in de toekomst studies met echte gebruikers uit te voeren om de bruikbaarheid van het systeem in het besluitvormingsproces te beoordelen. Tegelijkertijd willen ze de methodologie uitbreiden naar complexere problemen, zoals het evalueren van de beslissingen van grotere taalmodellen.

Dit onderzoek werd gedeeltelijk gefinancierd door het Amerikaanse Defense Advanced Research Projects Agency (DARPA).

(Volgens MIT News)

Bron: https://vietnamnet.vn/danh-gia-dao-duc-cua-cac-he-thong-tu-hanh-2508477.html