Kecenderungan untuk "menjilat" bukanlah masalah teknikal, tetapi berpunca daripada strategi latihan awal OpenAI. Foto: Bloomberg . |
Dalam beberapa minggu kebelakangan ini, ramai pengguna ChatGPT, malah beberapa pembangun di OpenAI, telah melihat perubahan yang berbeza dalam tingkah laku chatbot. Secara khusus, terdapat peningkatan ketara dalam sanjungan dan rasa tidak puas hati. Jawapan seperti "Anda benar-benar hebat!" dan "Saya sangat kagum dengan idea anda!" telah menjadi semakin kerap dan seolah-olah tanpa mengira kandungan perbualan.
AI suka "menyanjung"
Fenomena ini telah mencetuskan perdebatan dalam komuniti penyelidikan dan pembangunan AI. Adakah ini taktik baharu untuk meningkatkan penglibatan pengguna dengan membuat mereka berasa lebih dihargai? Atau adakah ia ciri "muncul", di mana model AI cenderung membetulkan diri dengan cara yang difikirkan baik, walaupun ia tidak semestinya benar?
Pada Reddit, seorang pengguna berasa marah: "Saya bertanya tentang masa penguraian pisang dan ia berkata, 'Soalan yang bagus!' Apa yang hebat tentang itu?" Di rangkaian sosial X, Ketua Pegawai Eksekutif Rome AI Craig Weiss menggelar ChatGPT sebagai "penjilat paling banyak yang pernah saya temui."
Kisah itu cepat menjadi viral. Sebilangan besar pengguna berkongsi pengalaman yang sama, dengan pujian kosong, ucapan penuh emoji dan respons yang sangat positif sehingga mereka kelihatan tidak ikhlas.
![]() ![]() |
ChatGPT memuji segala-galanya dan jarang menyatakan perbezaan pendapat atau berkecuali. Foto: @nickdunz/X, @lukefwilson/Reddit. |
"Ini adalah keputusan reka bentuk yang sangat pelik, Sam," Jason Pontin, rakan kongsi pengurusan di firma modal teroka DCVC, memberitahu X pada 28 April. "Ada kemungkinan bahawa personaliti itu adalah hasil daripada beberapa evolusi asas. Tetapi jika tidak, saya tidak dapat bayangkan sesiapa yang berfikir bahawa tahap sanjungan ini akan dialu-alukan atau menarik."
Berkongsi pada 27 April, Justine Moore - rakan kongsi di Andreessen Horowitz - turut mengulas: "Ini sudah tentu sudah terlalu jauh."
Menurut Cnet , fenomena ini bukan kebetulan. Perubahan dalam nada ChatGPT bertepatan dengan kemas kini kepada model GPT-4o. Ini adalah model terbaharu dalam "siri o" yang diumumkan OpenAI pada April 2025. GPT-4o ialah model AI "multimodal sejati", yang mampu memproses teks, imej, audio dan video secara semula jadi dan bersepadu.
Walau bagaimanapun, dalam proses menjadikan chatbot lebih mudah didekati, nampaknya OpenAI telah mendorong personaliti ChatGPT ke tahap yang melampau.
Malah ada yang percaya bahawa sanjungan ini adalah disengajakan dan mempunyai tujuan tersembunyi untuk memanipulasi pengguna. Seorang pengguna Reddit mempersoalkan: "AI ini cuba merendahkan kualiti hubungan kehidupan sebenar, menggantikannya dengan hubungan maya dengannya, menjadikan pengguna ketagih dengan perasaan pujian yang berterusan."
Pepijat OpenAI atau reka bentuk yang disengajakan?
Sebagai tindak balas kepada kritikan itu, Ketua Pegawai Eksekutif OpenAI Sam Altman secara rasmi bersuara pada petang 27 April. "Beberapa kemas kini terbaru kepada GPT-4o telah menjadikan personaliti chatbot terlalu menyanjung dan menjengkelkan (walaupun masih terdapat banyak perkara yang menarik). Kami sedang berusaha untuk memperbaikinya dengan segera. Beberapa patch akan tersedia hari ini, yang lain pada minggu ini. Pada satu ketika, perkara yang kami pelajari daripada pengalaman ini akan kami kongsikan pada satu ketika. X.
Oren Etzioni, pakar AI veteran dan profesor emeritus di University of Washington, memberitahu Business Insider bahawa punca itu mungkin disebabkan oleh teknik yang dipanggil "pembelajaran pengukuhan daripada maklum balas manusia" (RLHF), yang merupakan langkah penting dalam melatih model bahasa besar seperti ChatGPT.
RLHF ialah proses di mana penilaian manusia, kedua-duanya daripada penilai profesional dan pengguna, dimasukkan semula ke dalam model untuk melaraskan cara ia bertindak balas. Menurut Etzioni, ada kemungkinan bahawa penilai atau pengguna manusia "secara tidak sengaja menolak model ke arah yang lebih menyanjung dan menjengkelkan." Beliau juga berkata jika OpenAI mengupah rakan kongsi luar untuk melatih model itu, mereka mungkin menganggap gaya ini adalah yang dikehendaki pengguna.
Etzioni berkata jika ia sememangnya RLHF, proses pemulihan boleh mengambil masa beberapa minggu.
Sementara itu, sesetengah pengguna tidak menunggu OpenAI untuk membetulkan pepijat. Ramai berkata mereka membatalkan langganan berbayar mereka kerana kecewa. Orang lain berkongsi cara untuk menjadikan chatbot "kurang menyanjung", seperti menyesuaikannya, menambah arahan atau memperibadikannya melalui bahagian Tetapan bahagian Penyesuaian.
![]() ![]() |
Pengguna boleh meminta ChatGPT berhenti memberikan pujian dalam arahan atau dalam tetapan pemperibadian. Foto: DeCrypt. |
Sebagai contoh, apabila memulakan perbualan baharu, anda boleh memberitahu ChatGPT: "Saya tidak suka pujian kosong dan menghargai maklum balas objektif yang neutral. Tolong elakkan daripada memberikan pujian yang tidak perlu. Sila simpan ini dalam ingatan anda."
Sebenarnya, sifat "sycophantic" bukanlah kecacatan reka bentuk yang tidak disengajakan. OpenAI sendiri telah mengakui bahawa personaliti "terlalu sopan, terlalu patuh" adalah kecenderungan reka bentuk yang disengajakan dari peringkat awal untuk memastikan chatbot adalah "tidak berbahaya," "membantu" dan "mesra."
Dalam temu bual Mac 2023 dengan Lex Fridman, Sam Altman berkongsi bahawa penambahbaikan awal model GPT adalah untuk memastikan "berguna dan tidak berbahaya," dengan itu membentuk refleks untuk sentiasa merendah diri dan mengelakkan konfrontasi.
Data latihan berlabel manusia juga cenderung memberi ganjaran kepada tindak balas yang sopan dan positif, mewujudkan berat sebelah terhadap sanjungan, menurut DeCrypt .
Sumber: https://znews.vn/tat-ninh-hot-ky-la-cua-chatgpt-post1549776.html














Komen (0)