Vietnam.vn - Nền tảng quảng bá Việt Nam

Model AI yang ditemukan dapat menipu manusia

DNVN - OpenAI baru saja menerbitkan penelitian tentang cara mencegah model AI "konspiratif" - yang berarti "AI yang berperilaku dengan satu cara di permukaan tetapi memiliki tujuan nyata yang berbeda di dalamnya".

Tạp chí Doanh NghiệpTạp chí Doanh Nghiệp19/09/2025

Ảnh minh hoạ

Foto ilustrasi

Fakta bahwa model AI bisa berbohong bukanlah hal baru. Kebanyakan orang pernah mengalami "halusinasi AI", di mana model yang percaya diri memberikan jawaban yang tidak benar. Namun, halusinasi pada dasarnya adalah tentang membuat tebakan yang meyakinkan.

Namun, model AI yang bertindak seolah-olah mematuhi perintah tetapi sebenarnya menyembunyikan niat sebenarnya adalah masalah lain.

Tantangan mengendalikan AI

Apollo Research pertama kali menerbitkan sebuah makalah pada bulan Desember yang mendokumentasikan bagaimana lima model merencanakan ketika mereka diinstruksikan untuk mencapai suatu tujuan “dengan segala cara.”

Yang paling mengejutkan adalah jika sebuah model menyadari bahwa dirinya sedang diuji, ia dapat berpura-pura tidak terlibat konspirasi hanya untuk lulus uji, meskipun sebenarnya ia tetap terlibat konspirasi. "Model seringkali lebih sadar bahwa mereka sedang dievaluasi," tulis para peneliti.

Pengembang AI belum menemukan cara melatih model mereka agar tidak melakukan plotting. Hal ini karena hal tersebut justru dapat melatih model untuk melakukan plotting dengan lebih baik sehingga menghindari deteksi.

Mungkin dapat dimengerti bahwa model AI dari banyak pihak sengaja menipu manusia, karena model tersebut dibuat untuk mensimulasikan manusia dan sebagian besar dilatih pada data yang dihasilkan manusia.

Solusi dan peringatan

Kabar baiknya, para peneliti melihat penurunan signifikan dalam konspirasi menggunakan teknik anti-konspirasi yang disebut "asosiasi yang disengaja". Teknik ini, mirip dengan meminta anak mengulang aturan sebelum bermain, memaksa AI untuk berpikir sebelum bertindak.

Para peneliti memperingatkan tentang masa depan di mana AI ditugaskan dengan tugas-tugas yang lebih kompleks: "Seiring AI ditugaskan dengan tugas-tugas yang lebih kompleks dan mulai mengejar tujuan jangka panjang yang lebih ambigu, kami memperkirakan bahwa kemungkinan niat jahat akan meningkat, yang membutuhkan peningkatan perlindungan dan kemampuan pengujian yang ketat."

Ini adalah sesuatu yang layak direnungkan saat dunia korporat bergerak menuju masa depan AI, di mana perusahaan percaya AI dapat diperlakukan seperti karyawan independen.

Hien Thao (Menurut TechCrunch)

Source: https://doanhnghiepvn.vn/chuyen-doi-so/phat-hien-mo-hinh-ai-biet-lua-doi-con-nguoi/20250919055143362


Komentar (0)

No data
No data

Dalam topik yang sama

Dalam kategori yang sama

Vietnam menangkan kompetisi musik Intervision 2025
Kemacetan Mu Cang Chai hingga malam, wisatawan berbondong-bondong berburu nasi matang musim ini
Musim emas yang damai di Hoang Su Phi di pegunungan tinggi Tay Con Linh
Desa di Da Nang masuk dalam 50 desa terindah di dunia tahun 2025

Dari penulis yang sama

Warisan

Angka

Bisnis

No videos available

Berita

Sistem Politik

Lokal

Produk