Penilaian etika sistem autonomi

Penyelidik MIT telah membangunkan rangka kerja ujian untuk membantu mengenal pasti situasi di mana sistem sokongan membuat keputusan AI gagal memastikan keadilan untuk individu dan komuniti.

VietNamNet•23/04/2026

Imej untuk pelajaran 31.png — MIT sedang membangunkan rangka kerja ujian untuk membantu mengesan AI yang membuat keputusan yang tidak adil. Foto: Midjourney

Kecerdasan buatan semakin banyak digunakan untuk mengoptimumkan keputusan dalam konteks kritikal. Contohnya, sistem autonomi boleh mencadangkan pelan pengagihan kuasa yang paling kos efektif sambil mengekalkan kestabilan voltan.

Walau bagaimanapun, adakah penyelesaian "optimum dari segi teknikal" benar-benar adil? Apa yang berlaku jika strategi kos rendah menjadikan kawasan berpendapatan rendah lebih terdedah kepada gangguan bekalan elektrik berbanding kawasan yang lebih kaya?

Bagi membantu pihak berkepentingan mengesan risiko etika lebih awal sebelum pelaksanaan, pasukan penyelidikan MIT telah membangunkan kaedah penilaian automatik yang mengimbangi penunjuk kuantitatif (seperti kos dan kebolehpercayaan) dengan nilai kualitatif (seperti keadilan).

Sistem ini memisahkan penilaian objektif daripada nilai-nilai kemanusiaan yang ditakrifkan pengguna dan menggunakan model bahasa besar (LLM) sebagai "wakil" manusia untuk merekod dan mengintegrasikan keutamaan pihak berkepentingan.

Rangka kerja penilaian adaptif akan memilih senario yang paling penting untuk analisis selanjutnya, sekali gus memudahkan proses yang akan memakan masa dan kos jika dilakukan secara manual. Senario ini boleh menunjukkan bila sistem AI sejajar dengan nilai-nilai kemanusiaan, serta bila ia gagal memenuhi kriteria etika.

Menurut Chuchu Fan (MIT), hanya menetapkan peraturan atau "halangan keselamatan" untuk AI tidak mencukupi, kerana ini hanya menghalang risiko yang boleh diramalkan oleh manusia. Oleh itu, pendekatan sistematik diperlukan untuk mengesan "risiko yang tidak diketahui" sebelum ia menyebabkan akibat.

Penilaian etika dalam sistem kompleks

Dalam sistem besar seperti grid kuasa, menilai kesesuaian etika cadangan yang dijana AI adalah mencabar, terutamanya apabila pelbagai objektif mesti dipertimbangkan secara serentak.

Kaedah semasa sering bergantung pada data yang sedia ada, tetapi data yang dilabel mengikut kriteria etika jarang berlaku. Pada masa yang sama, nilai etika dan sistem AI sentiasa berubah, dengan cepat menjadikan kaedah penilaian statik usang.

Pasukan penyelidikan telah membangunkan rangka kerja reka bentuk eksperimen yang dipanggil SEED-SET, yang terdiri daripada dua bahagian:

- Model objektif: menilai prestasi berdasarkan petunjuk yang boleh diukur (seperti kos)
- Model subjektif: mencerminkan pertimbangan manusia (seperti perasaan keadilan)
Pendekatan ini membolehkan pengenalpastian senario yang memenuhi kriteria teknikal dan nilai-nilai kemanusiaan, atau sebaliknya.

Khususnya, SEED-SET tidak memerlukan data penilaian sedia ada dan boleh menyesuaikan diri dengan pelbagai objektif. Contohnya, dalam sistem elektrik, kumpulan pengguna yang berbeza (seperti komuniti luar bandar dan pusat data) mungkin mempunyai keutamaan etika yang berbeza walaupun kedua-duanya menginginkan elektrik yang berpatutan dan stabil.

Faktor subjektif pemodelan

Untuk menilai faktor subjektif, sistem ini menggunakan LLM sebagai wakil penilai. Keutamaan setiap kumpulan dikodkan ke dalam pernyataan bahasa semula jadi.

LLM akan membandingkan senario dan memilih pilihan yang lebih sesuai berdasarkan kriteria etika. Pendekatan ini membantu mengelakkan keletihan dan ketidakkonsistenan manusia ketika menilai ratusan atau ribuan senario.

SEED-SET kemudian menggunakan senario yang dipilih untuk mensimulasikan sistem (contohnya, strategi pengagihan kuasa) dan terus mencari senario baharu dengan nilai penilaian yang lebih tinggi.

Hasil akhirnya adalah satu set senario tipikal, yang membolehkan pengguna menganalisis prestasi sistem AI dan menyesuaikan strategi mereka mengikut keperluan.

Sebagai contoh, sistem ini boleh mengesan keadaan di mana pengagihan kuasa mengutamakan kawasan berpendapatan tinggi semasa waktu puncak, menjadikan kawasan yang kurang bernasib baik lebih terdedah kepada gangguan bekalan elektrik.

Keberkesanan dan pembangunan masa hadapan

Apabila diuji pada sistem dunia sebenar seperti grid pintar atau pengurusan trafik bandar, SEED-SET menjana dua kali ganda senario optimum berbanding kaedah tradisional, di samping mengesan lebih banyak situasi yang terlepas pandang oleh kaedah lain.

Terutamanya, apabila pilihan pengguna berubah, senario yang dijana oleh sistem juga berubah dengan ketara, menunjukkan tahap kebolehsuaian yang tinggi terhadap nilai-nilai kemanusiaan.

Pada masa hadapan, pasukan penyelidikan merancang untuk menjalankan kajian dengan pengguna sebenar bagi menilai kegunaan sistem dalam proses membuat keputusan. Pada masa yang sama, mereka berhasrat untuk mengembangkan metodologi kepada masalah yang lebih kompleks, seperti menilai keputusan model bahasa yang lebih besar.

Penyelidikan ini sebahagiannya dibiayai oleh Agensi Projek Penyelidikan Lanjutan Pertahanan A.S. (DARPA).

(Menurut Berita MIT)

Sumber: https://vietnamnet.vn/danh-gia-dao-duc-cua-cac-he-thong-tu-hanh-2508477.html