Afbeelding voor les 31.png
MIT ontwikkelt een testframework om te helpen detecteren of AI oneerlijke beslissingen neemt. Foto: Midjourney

Kunstmatige intelligentie wordt steeds vaker ingezet om beslissingen in kritieke situaties te optimaliseren. Zo kan een autonoom systeem bijvoorbeeld het meest kostenefficiënte stroomdistributieplan voorstellen, terwijl de spanningsstabiliteit behouden blijft.

Is een "technisch optimale" oplossing echter wel echt eerlijk? Wat gebeurt er als een goedkope strategie ervoor zorgt dat achterstandsgebieden kwetsbaarder zijn voor stroomuitval dan rijkere gebieden?

Om belanghebbenden te helpen ethische risico's vroegtijdig te detecteren, vóór de implementatie, heeft het MIT-onderzoeksteam een ​​geautomatiseerde beoordelingsmethode ontwikkeld die kwantitatieve indicatoren (zoals kosten en betrouwbaarheid) afweegt tegen kwalitatieve waarden (zoals rechtvaardigheid).

Dit systeem scheidt objectieve evaluatie van door de gebruiker gedefinieerde menselijke waarden en gebruikt een groot taalmodel (LLM) als een menselijke "vertegenwoordiger" om de prioriteiten van belanghebbenden vast te leggen en te integreren.

Het adaptieve evaluatiekader selecteert de belangrijkste scenario's voor verdere analyse, waardoor een proces dat handmatig kostbaar en tijdrovend zou zijn, wordt vereenvoudigd. Deze scenario's kunnen aangeven wanneer een AI-systeem aansluit bij menselijke waarden, en wanneer het niet voldoet aan ethische criteria.

Volgens Chuchu Fan (MIT) is het simpelweg vaststellen van regels of "veiligheidsbarrières" voor AI onvoldoende, omdat deze alleen risico's voorkomen die mensen kunnen voorzien. Daarom is een systematische aanpak nodig om "onbekende risico's" te detecteren voordat ze gevolgen hebben.

Ethische evaluatie in complexe systemen

In grote systemen zoals elektriciteitsnetten is het beoordelen van de ethische aanvaardbaarheid van door AI gegenereerde voorstellen een uitdaging, vooral wanneer er tegelijkertijd rekening moet worden gehouden met meerdere doelstellingen.