Obrázek pro lekci 31.png
MIT vyvíjí testovací rámec, který pomůže odhalit nekalá rozhodnutí umělé inteligence. Foto: Midjourney

Umělá inteligence se stále častěji využívá k optimalizaci rozhodnutí v kritických situacích. Například autonomní systém dokáže navrhnout nákladově nejefektivnější plán distribuce energie a zároveň zachovat stabilitu napětí.

Je však „technicky optimální“ řešení skutečně spravedlivé? Co se stane, když nízkonákladová strategie učiní oblasti s nízkými příjmy zranitelnějšími vůči výpadkům proudu než oblasti bohatší?

Aby pomohl zúčastněným stranám odhalit etická rizika včas před implementací, vyvinul výzkumný tým MIT automatizovanou metodu hodnocení, která vyvažuje kvantitativní ukazatele (jako jsou náklady a spolehlivost) s kvalitativními hodnotami (jako je spravedlnost).

Tento systém odděluje objektivní hodnocení od uživatelem definovaných lidských hodnot a používá model velkého jazyka (LLM) jako lidského „zástupce“ k zaznamenávání a integraci priorit zúčastněných stran.

Adaptivní hodnotící rámec vybere nejdůležitější scénáře pro další analýzu, čímž zjednoduší proces, který by byl při ručním provádění nákladný a časově náročný. Tyto scénáře mohou naznačovat, kdy systém umělé inteligence odpovídá lidským hodnotám, a také kdy nesplňuje etická kritéria.

Podle Chuchu Fana (MIT) pouhé stanovení pravidel nebo „bezpečnostních bariér“ pro umělou inteligenci nestačí, protože ty pouze zabraňují rizikům, která lidé dokáží předvídat. Proto je zapotřebí systematický přístup k odhalení „neznámých rizik“ dříve, než způsobí následky.

Etické hodnocení ve složitých systémech

Ve velkých systémech, jako jsou energetické sítě, je posouzení etické vhodnosti návrhů generovaných umělou inteligencí náročné, zejména pokud je třeba současně zohlednit více cílů.