Ders 31 için resim.png
MIT, yapay zekanın haksız kararlar vermesini tespit etmeye yardımcı olacak bir test çerçevesi geliştiriyor. Fotoğraf: Midjourney

Yapay zekâ, kritik bağlamlarda kararları optimize etmek için giderek daha fazla kullanılmaktadır. Örneğin, otonom bir sistem, voltaj kararlılığını korurken en uygun maliyetli güç dağıtım planını önerebilir.

Ancak, "teknik olarak en uygun" çözüm gerçekten adil midir? Düşük maliyetli bir strateji, düşük gelirli bölgeleri daha varlıklı bölgelere göre elektrik kesintilerine karşı daha savunmasız hale getirirse ne olur?

Paydaşların uygulama öncesinde etik riskleri erken tespit etmelerine yardımcı olmak amacıyla, MIT araştırma ekibi, nicel göstergeleri (maliyet ve güvenilirlik gibi) nitel değerlerle (adalet gibi) dengeleyen otomatik bir değerlendirme yöntemi geliştirdi.

Bu sistem, nesnel değerlendirmeyi kullanıcı tanımlı insani değerlerden ayırır ve paydaş önceliklerini kaydetmek ve entegre etmek için insan "temsilcisi" olarak büyük bir dil modeli (LLM) kullanır.

Uyarlanabilir değerlendirme çerçevesi, daha fazla analiz için en önemli senaryoları seçerek, manuel olarak yapıldığında maliyetli ve zaman alıcı olacak bir süreci basitleştirir. Bu senaryolar, bir yapay zeka sisteminin insan değerleriyle ne zaman uyumlu olduğunu ve ne zaman etik kriterleri karşılamadığını gösterebilir.

MIT'den Chuchu Fan'a göre, yapay zekâ için kurallar veya "güvenlik bariyerleri" belirlemek yetersizdir, çünkü bunlar yalnızca insanların öngörebileceği riskleri önler. Bu nedenle, sonuçlara yol açmadan önce "bilinmeyen riskleri" tespit etmek için sistematik bir yaklaşıma ihtiyaç vardır.

Karmaşık sistemlerde etik değerlendirme

Elektrik şebekeleri gibi büyük sistemlerde, özellikle birden fazla hedefin aynı anda dikkate alınması gerektiğinde, yapay zeka tarafından üretilen önerilerin etik açıdan uygunluğunu değerlendirmek zordur.