Imagem para a lição 31.png
O MIT está desenvolvendo uma estrutura de testes para ajudar a detectar se a IA está tomando decisões injustas. Foto: Midjourney

A inteligência artificial está sendo cada vez mais aplicada para otimizar decisões em contextos críticos. Por exemplo, um sistema autônomo pode sugerir o plano de distribuição de energia mais econômico, mantendo a estabilidade da tensão.

No entanto, uma solução "tecnicamente ótima" é realmente justa? O que acontece se uma estratégia de baixo custo tornar as áreas de baixa renda mais vulneráveis ​​a apagões do que as áreas mais ricas?

Para ajudar as partes interessadas a detectar riscos éticos precocemente, antes da implementação, a equipe de pesquisa do MIT desenvolveu um método de avaliação automatizado que equilibra indicadores quantitativos (como custo e confiabilidade) com valores qualitativos (como equidade).

Este sistema separa a avaliação objetiva dos valores humanos definidos pelo usuário e utiliza um modelo de linguagem abrangente (LLM, na sigla em inglês) como um "representante" humano para registrar e integrar as prioridades das partes interessadas.

A estrutura de avaliação adaptativa selecionará os cenários mais importantes para análise posterior, simplificando um processo que seria dispendioso e demorado se realizado manualmente. Esses cenários podem indicar quando um sistema de IA está alinhado com os valores humanos, bem como quando deixa de atender aos critérios éticos.

Segundo Chuchu Fan (MIT), simplesmente definir regras ou "barreiras de segurança" para a IA é insuficiente, pois estas apenas previnem riscos que os humanos conseguem prever. Portanto, é necessária uma abordagem sistemática para detectar "riscos desconhecidos" antes que causem consequências.

Avaliação ética em sistemas complexos

Em sistemas de grande porte, como redes elétricas, avaliar a adequação ética de propostas geradas por IA é um desafio, especialmente quando múltiplos objetivos precisam ser considerados simultaneamente.