Otonom sistemlerin etik değerlendirmesi

MIT araştırmacıları, yapay zekâ destekli karar verme sistemlerinin bireyler ve topluluklar için adaleti sağlamada başarısız olduğu durumları belirlemeye yardımcı olacak bir test çerçevesi geliştirdi.

VietNamNet•23/04/2026

Ders 31 için resim.png — MIT, yapay zekanın haksız kararlar vermesini tespit etmeye yardımcı olacak bir test çerçevesi geliştiriyor. Fotoğraf: Midjourney

Yapay zekâ, kritik bağlamlarda kararları optimize etmek için giderek daha fazla kullanılmaktadır. Örneğin, otonom bir sistem, voltaj kararlılığını korurken en uygun maliyetli güç dağıtım planını önerebilir.

Ancak, "teknik olarak en uygun" çözüm gerçekten adil midir? Düşük maliyetli bir strateji, düşük gelirli bölgeleri daha varlıklı bölgelere göre elektrik kesintilerine karşı daha savunmasız hale getirirse ne olur?

Paydaşların uygulama öncesinde etik riskleri erken tespit etmelerine yardımcı olmak amacıyla, MIT araştırma ekibi, nicel göstergeleri (maliyet ve güvenilirlik gibi) nitel değerlerle (adalet gibi) dengeleyen otomatik bir değerlendirme yöntemi geliştirdi.

Bu sistem, nesnel değerlendirmeyi kullanıcı tanımlı insani değerlerden ayırır ve paydaş önceliklerini kaydetmek ve entegre etmek için insan "temsilcisi" olarak büyük bir dil modeli (LLM) kullanır.

Uyarlanabilir değerlendirme çerçevesi, daha fazla analiz için en önemli senaryoları seçerek, manuel olarak yapıldığında maliyetli ve zaman alıcı olacak bir süreci basitleştirir. Bu senaryolar, bir yapay zeka sisteminin insan değerleriyle ne zaman uyumlu olduğunu ve ne zaman etik kriterleri karşılamadığını gösterebilir.

MIT'den Chuchu Fan'a göre, yapay zekâ için kurallar veya "güvenlik bariyerleri" belirlemek yetersizdir, çünkü bunlar yalnızca insanların öngörebileceği riskleri önler. Bu nedenle, sonuçlara yol açmadan önce "bilinmeyen riskleri" tespit etmek için sistematik bir yaklaşıma ihtiyaç vardır.

Karmaşık sistemlerde etik değerlendirme

Elektrik şebekeleri gibi büyük sistemlerde, özellikle birden fazla hedefin aynı anda dikkate alınması gerektiğinde, yapay zeka tarafından üretilen önerilerin etik açıdan uygunluğunu değerlendirmek zordur.

Mevcut yöntemler genellikle kolayca erişilebilen verilere dayanır, ancak etik kriterlere göre etiketlenmiş veriler nadirdir. Aynı zamanda, etik değerler ve yapay zeka sistemleri sürekli değişmekte ve statik değerlendirme yöntemlerini hızla geçersiz kılmaktadır.

Araştırma ekibi, iki bölümden oluşan SEED-SET adlı bir deneysel tasarım çerçevesi geliştirdi:

- Objektif model: Performansı ölçülebilir göstergelere (örneğin maliyetlere) göre değerlendirir.
- Öznel model: İnsan yargısını yansıtır (örneğin adalet duygusu).
Bu yaklaşım, hem teknik kriterleri hem de insani değerleri karşılayan veya tam tersi olan senaryoların belirlenmesine olanak tanır.

Özellikle SEED-SET, önceden var olan değerlendirme verilerine ihtiyaç duymaz ve çok çeşitli amaçlara uyum sağlayabilir. Örneğin, bir elektrik sisteminde, farklı kullanıcı grupları (kırsal topluluklar ve veri merkezleri gibi), her ikisi de uygun fiyatlı ve istikrarlı elektrik istemelerine rağmen, farklı etik önceliklere sahip olabilirler.

öznel faktörlerin modellenmesi

Öznel faktörleri değerlendirmek için sistem, değerlendiriciyi temsil eden bir unsur olarak LLM'yi kullanır. Her grubun tercihleri doğal dil ifadelerine kodlanır.

LLM, senaryoları karşılaştıracak ve etik kriterlere göre daha uygun seçeneği belirleyecektir. Bu yaklaşım, yüzlerce veya binlerce senaryoyu değerlendirirken insan yorgunluğunu ve tutarsızlığını önlemeye yardımcı olur.

SEED-SET daha sonra seçilen senaryoları kullanarak sistemi simüle eder (örneğin, güç dağıtım stratejisi) ve daha yüksek değerlendirme değerine sahip yeni senaryolar aramaya devam eder.

Sonuç olarak, kullanıcıların yapay zeka sisteminin performansını analiz etmelerine ve stratejilerini gerektiği gibi ayarlamalarına olanak tanıyan bir dizi tipik senaryo elde edilir.

Örneğin, sistem, elektrik dağıtımında en yoğun saatlerde yüksek gelirli bölgelere öncelik verildiği ve bu durumun dezavantajlı bölgeleri elektrik kesintilerine karşı daha savunmasız hale getirdiği durumları tespit edebilir.

Etkinlik ve gelecekteki gelişim

Akıllı şebekeler veya kentsel trafik yönetimi gibi gerçek dünya sistemlerinde test edildiğinde, SEED-SET geleneksel yöntemlere göre iki kat daha fazla optimal senaryo üretirken, diğer yöntemlerin gözden kaçırdığı daha fazla durumu da tespit ediyor.

Özellikle, kullanıcı tercihleri değiştiğinde, sistem tarafından oluşturulan senaryolar da önemli ölçüde değişmekte ve insan değerlerine yüksek derecede uyum sağlama yeteneği göstermektedir.

Araştırma ekibi gelecekte, sistemin karar verme sürecindeki faydasını değerlendirmek için gerçek kullanıcılarla çalışmalar yürütmeyi planlıyor. Eş zamanlı olarak, metodolojiyi daha karmaşık sorunlara, örneğin daha büyük dil modellerinin kararlarını değerlendirmeye genişletmeyi hedefliyorlar.

Bu araştırma kısmen ABD Savunma İleri Araştırma Projeleri Ajansı (DARPA) tarafından finanse edilmiştir.

(MIT Haberlerine göre)

Kaynak: https://vietnamnet.vn/danh-gia-dao-duc-cua-cac-he-thong-tu-hanh-2508477.html