Sekumpulan penyelidik di Jerman baru-baru ini mengeluarkan amaran tentang potensi bias dalam penggunaan chatbot AI untuk memendekkan kandungan penyelidikan. Selepas menganalisis 4,900 abstrak saintifik yang ditulis oleh manusia, kumpulan itu menggunakan pelbagai model AI untuk membandingkan cara sistem ini memproses maklumat. Keputusan menunjukkan bahawa kebanyakan chatbot melakukan kesilapan dengan pengitlakan yang berlebihan, walaupun diminta untuk meringkaskannya dengan tepat.
ChatGPT dan DeepSeek memutarbelitkan data saintifik.
Model AI seperti ChatGPT dan DeepSeek didapati berupaya memesongkan kandungan saintifik apabila meringkaskannya, terutamanya dalam bidang perubatan.
AI boleh memesongkan kandungan dengan mudah apabila meringkaskan penyelidikan saintifik.
Dalam eksperimen tersebut, model AI membuat ralat lima kali ganda lebih banyak berbanding penyelidik manusia apabila dibiarkan tanpa panduan. Walaupun dengan keperluan ketepatan yang jelas, kadar ralat masih dua kali ganda lebih tinggi berbanding ringkasan standard. Seorang ahli pasukan penyelidikan mengulas, “Pengitlakan mungkin kelihatan tidak berbahaya pada masa-masa tertentu, tetapi ia sebenarnya mengubah sifat penyelidikan asal. Ia adalah bias sistemik.”
Terutamanya, versi chatbot yang lebih baharu bukan sahaja gagal menangani masalah tersebut tetapi sebenarnya memburukkannya lagi. Dengan penyampaiannya yang lancar dan menarik, ringkasan yang dijana AI dengan mudah memberikan gambaran kepercayaan, manakala kandungan sebenar diputarbelitkan. Dalam satu contoh, DeepSeek menukar frasa "selamat dan berjaya dilaksanakan" kepada "rawatan yang selamat dan berkesan"—satu tafsiran yang menyimpang daripada kesimpulan asal kajian.
Dalam contoh lain, model Llama menggunakan cadangan ubat diabetes kepada subjek muda tanpa menyatakan dos, kekerapan atau kesan sampingan. Jika pembaca, doktor atau profesional penjagaan kesihatan , tidak mengesahkan kajian asal, ringkasan jenis ini boleh menimbulkan bahaya langsung kepada pesakit.
Pakar percaya fenomena ini berpunca daripada cara model AI dilatih. Banyak chatbot semasa dilatih menggunakan data sekunder – seperti berita saintifik yang dihasilkan secara besar-besaran – yang telah dipermudahkan. Memandangkan AI terus meringkaskan kandungan yang dipermudahkan ini, risiko herotan meningkat.
Pakar AI dalam bidang kesihatan mental berhujah bahawa halangan teknikal terhadap pembangunan dan penggunaan AI perlu diwujudkan tidak lama lagi.
Pengguna harus berhati-hati kerana chatbot boleh memesongkan kandungan dengan mudah.
Memandangkan pengguna semakin bergantung pada chatbot AI untuk mempelajari maklumat saintifik, ketidaktepatan kecil dalam tafsiran boleh terkumpul dan merebak dengan cepat, yang membawa kepada salah tanggapan yang meluas. Pada masa kepercayaan terhadap sains semakin berkurangan, risiko ini amat membimbangkan dan memerlukan perhatian sewajarnya.
Mengintegrasikan AI ke dalam penyelidikan dan penyebaran pengetahuan merupakan trend yang tidak dapat dipulihkan. Walau bagaimanapun, pakar menegaskan bahawa teknologi tidak dapat menggantikan peranan manusia dalam memahami dan mengesahkan kandungan saintifik. Apabila menggunakan chatbot dalam bidang berisiko tinggi seperti penjagaan kesihatan, ketepatan mesti diutamakan, dan bukannya hanya tertumpu pada pengalaman bahasa yang lancar atau kelajuan tindak balas.
Sumber: https://khoahocdoisong.vn/chatgpt-deepseek-bop-meo-du-lieu-khoa-hoc-post1552971.html











