Bild för lektion 31.png
MIT utvecklar ett testramverk för att upptäcka AI som fattar orättvisa beslut. Foto: Midjourney

Artificiell intelligens används alltmer för att optimera beslut i kritiska sammanhang. Till exempel kan ett autonomt system föreslå den mest kostnadseffektiva kraftdistributionsplanen samtidigt som spänningsstabilitet bibehålls.

Men är en "tekniskt optimal" lösning verkligen rättvis? Vad händer om en lågkostnadsstrategi gör låginkomstområden mer sårbara för strömavbrott än rikare områden?

För att hjälpa intressenter att upptäcka etiska risker tidigt före implementering utvecklade MIT-forskargruppen en automatiserad bedömningsmetod som balanserar kvantitativa indikatorer (såsom kostnad och tillförlitlighet) med kvalitativa värden (såsom rättvisa).

Detta system separerar objektiv utvärdering från användardefinierade mänskliga värden och använder en stor språkmodell (LLM) som en mänsklig "representant" för att registrera och integrera intressenternas prioriteringar.

Det adaptiva utvärderingsramverket kommer att välja ut de viktigaste scenarierna för vidare analys, vilket förenklar en process som skulle vara kostsam och tidskrävande om den gjordes manuellt. Dessa scenarier kan indikera när ett AI-system överensstämmer med mänskliga värderingar, såväl som när det inte uppfyller etiska kriterier.

Enligt Chuchu Fan (MIT) räcker det inte att bara sätta upp regler eller "säkerhetsbarriärer" för AI, eftersom dessa bara förhindrar risker som människor kan förutse. Därför behövs en systematisk metod för att upptäcka "okända risker" innan de orsakar konsekvenser.

Etisk utvärdering i komplexa system

I stora system som elnät är det utmanande att bedöma den etiska lämpligheten hos AI-genererade förslag, särskilt när flera mål måste beaktas samtidigt.