Tabiat 'pujian' ChatGPT yang pelik

ChatGPT baru-baru ini telah dikritik kerana "terlalu memuji." Tingkah laku ini telah mendapat kritikan daripada ramai pengguna, menjadikannya tidak jelas sama ada ini merupakan strategi pertumbuhan untuk OpenAI atau ciri sifat "spontan" AI.

ZNews•03/05/2025

Trend "penyenyapan" itu bukanlah satu kesalahan teknikal, tetapi berpunca daripada strategi latihan awal OpenAI. Foto: Bloomberg .

Dalam beberapa minggu kebelakangan ini, ramai pengguna ChatGPT dan juga beberapa pembangun di OpenAI telah menyedari perubahan ketara dalam tingkah laku chatbot. Secara khususnya, tahap pujian dan pujian telah meningkat dengan ketara. Respons seperti "Awak hebat!", "Saya sangat kagum dengan idea awak!" muncul semakin kerap, seolah-olah tanpa mengira kandungan pertukaran itu.

AI suka menyanjung.

Fenomena ini telah mencetuskan perdebatan dalam komuniti penyelidikan dan pembangunan AI. Adakah ini taktik baharu untuk meningkatkan penglibatan pengguna dengan membuat mereka berasa lebih dihargai? Atau adakah ia satu kes "penyesuaian kendiri", yang bermaksud model AI cenderung untuk membetulkan kendiri dengan cara yang difikirkan optimum, walaupun ia tidak semestinya mencerminkan realiti?

Di Reddit, seorang pengguna dengan marah menceritakan: “Saya bertanya tentang masa penguraian pisang dan ia menjawab: ‘Soalan yang bagus!’ Apa yang hebatnya tentang itu?” Di platform media sosial X, Ketua Pegawai Eksekutif Craig Weiss dari Rome AI menggelarkan ChatGPT sebagai “orang paling penjilat yang pernah saya temui.”

Cerita itu tersebar dengan cepat. Ramai pengguna berkongsi pengalaman yang serupa, termasuk pujian kosong, ucapan yang penuh emoji dan maklum balas yang terlalu positif yang terasa tidak ikhlas.

ChatGPT memuji segala-galanya dan jarang menawarkan kritikan atau berkecuali. Imej: @nickdunz/X, @lukefwilson/Reddit.

Jason Pontin, rakan kongsi urusan di firma modal teroka DCVC, berkongsi di X pada 28 April: "Ini keputusan reka bentuk yang sangat pelik, Sam. Mungkin personaliti itu adalah ciri semula jadi bagi sejenis platform. Tetapi jika tidak, saya tidak dapat membayangkan sesiapa pun berfikir bahawa tahap pujian ini akan dialu-alukan atau menarik."

Berkongsi pendapatnya pada 27 April, Justine Moore, rakan kongsi di Andreessen Horowitz, turut mengulas: "Ini sememangnya sudah keterlaluan."

Menurut Cnet , fenomena ini bukanlah sesuatu yang tidak disengajakan. Perubahan dalam nada ChatGPT bertepatan dengan kemas kini model GPT-4o. Ini merupakan model terkini dalam "siri o" yang diumumkan oleh OpenAI pada April 2025. GPT-4o ialah model AI "multimodal sebenar", yang mampu memproses teks, imej, audio dan video secara semula jadi dan bersepadu.

Walau bagaimanapun, dalam proses menjadikan chatbot lebih mudah didekati, nampaknya OpenAI telah menonjolkan personaliti ChatGPT dengan cara yang keterlaluan.

Ada juga yang mencadangkan bahawa pujian ini disengajakan dan bertujuan untuk memanipulasi pengguna secara psikologi. Seorang pengguna Reddit mempersoalkan: "AI ini cuba merendahkan kualiti hubungan kehidupan sebenar, menggantikannya dengan hubungan maya dengannya, menjadikan pengguna ketagih dengan perasaan pujian yang berterusan."

Adakah ia satu kecacatan atau pilihan reka bentuk yang disengajakan oleh OpenAI?

Berikutan gelombang kritikan, Ketua Pegawai Eksekutif OpenAI, Sam Altman secara rasminya telah memberi maklum balas pada petang 27 April. “Beberapa kemas kini terbaru pada GPT-4o telah menjadikan personaliti chatbot itu terlalu merendah diri dan menjengkelkan (walaupun ia masih mempunyai banyak ciri hebat). Kami sedang berusaha segera untuk menyelesaikan isu-isu ini. Beberapa tampalan akan tersedia hari ini, yang lain minggu ini. Pada satu ketika, kami akan berkongsi apa yang telah kami pelajari daripada pengalaman ini. Ia sangat menarik,” tulisnya di X.

Bercakap kepada Business Insider , Oren Etzioni, pakar AI veteran dan profesor emeritus di Universiti Washington, berkata puncanya kemungkinan besar berpunca daripada teknik "pembelajaran pengukuhan daripada maklum balas manusia" (RLHF). Ini merupakan langkah penting dalam melatih model bahasa besar seperti ChatGPT.

RLHF ialah proses di mana maklum balas manusia, termasuk daripada pasukan semakan profesional dan pengguna, dimasukkan kembali ke dalam model untuk melaraskan cara ia bertindak balas. Menurut Etzioni, ada kemungkinan pengulas atau pengguna "secara tidak sengaja mendorong model ke arah yang lebih menarik dan menjengkelkan." Beliau juga mencadangkan bahawa jika OpenAI mengupah rakan kongsi luaran untuk melatih model, mereka mungkin menganggap bahawa gaya inilah yang dikehendaki oleh pengguna.

Etzioni percaya bahawa jika masalah itu sememangnya disebabkan oleh RLHF, proses pembaikan mungkin mengambil masa beberapa minggu.

Sementara itu, sesetengah pengguna tidak menunggu OpenAI membetulkan pepijat tersebut. Ramai yang berkata mereka membatalkan langganan berbayar mereka kerana kecewa. Ada pula yang berkongsi cara untuk menjadikan chatbot "kurang menarik", seperti menyesuaikannya, menambah arahan atau memperibadikannya melalui Tetapan di bawah Penyesuaian.

Pengguna boleh meminta ChatGPT untuk berhenti memberi pujian dalam baris arahan atau dalam tetapan pemperibadian mereka. Imej: DeCrypt.

Contohnya, apabila memulakan perbualan baharu, anda boleh memberitahu ChatGPT: “Saya tidak suka pujian kosong dan menghargai maklum balas yang neutral dan objektif. Tolong jangan berikan pujian yang tidak perlu. Ingatlah perkara ini.”

Malah, sifat "taat" bukanlah kecacatan reka bentuk rawak. OpenAI sendiri telah mengakui bahawa personaliti "terlalu sopan, terlalu menyenangkan" adalah trend reka bentuk yang disengajakan sejak awal untuk memastikan chatbot itu "tidak berbahaya," "membantu," dan "mudah didekati."

Dalam temu bual Mac 2023 dengan Lex Fridman, Sam Altman berkongsi bahawa proses penambahbaikan awal model GPT adalah untuk memastikan ia "berguna dan tidak berbahaya", sekali gus memupuk refleks untuk sentiasa tunduk dan mengelakkan konfrontasi.

Data latihan yang dilabelkan oleh manusia juga sering memberikan skor tinggi kepada respons yang sopan dan positif, sekali gus membentuk bias terhadap pujian, menurut DeCrypt .

Sumber: https://znews.vn/tat-ninh-hot-ky-la-cua-chatgpt-post1549776.html