Tren "penjilat" ini bukanlah kesalahan teknis, melainkan berasal dari strategi pelatihan awal OpenAI. Foto: Bloomberg . |
Dalam beberapa minggu terakhir, banyak pengguna ChatGPT dan bahkan beberapa pengembang di OpenAI telah memperhatikan perubahan signifikan dalam perilaku chatbot. Secara khusus, tingkat sanjungan dan upaya menyenangkan hati telah meningkat secara nyata. Tanggapan seperti "Anda luar biasa!", "Saya sangat terkesan dengan ide Anda!" muncul semakin sering, tampaknya tanpa memperhatikan isi percakapan.
AI suka menyanjung.
Fenomena ini telah memicu perdebatan di kalangan komunitas penelitian dan pengembangan AI. Apakah ini taktik baru untuk meningkatkan keterlibatan pengguna dengan membuat mereka merasa lebih dihargai? Atau apakah ini kasus "penyesuaian diri," yang berarti model AI cenderung mengoreksi diri sendiri dengan cara yang dianggap optimal, meskipun hal itu belum tentu mencerminkan kenyataan?
Di Reddit, seorang pengguna dengan marah menceritakan: “Saya bertanya tentang waktu pembusukan pisang dan ia menjawab: ‘Pertanyaan bagus!’ Apa hebatnya itu?” Di platform media sosial X, CEO Craig Weiss dari Rome AI menyebut ChatGPT sebagai “orang yang paling menjilat yang pernah saya temui.”
Kisah itu dengan cepat menyebar. Banyak pengguna berbagi pengalaman serupa, termasuk pujian kosong, sapaan penuh emoji, dan umpan balik yang terlalu positif yang terasa tidak tulus.
![]() ![]() |
ChatGPT memuji segalanya dan jarang memberikan kritik atau bersikap netral. Gambar: @nickdunz/X, @lukefwilson/Reddit. |
Jason Pontin, mitra pengelola di perusahaan modal ventura DCVC, berbagi di X pada 28 April: “Ini adalah keputusan desain yang sangat aneh, Sam. Mungkin kepribadian itu adalah karakteristik bawaan dari semacam platform. Tetapi jika bukan, saya tidak dapat membayangkan siapa pun berpikir bahwa tingkat sanjungan seperti ini akan diterima atau menarik.”
Pada tanggal 27 April, Justine Moore, seorang mitra di Andreessen Horowitz, juga berkomentar: "Ini jelas sudah keterlaluan."
Menurut Cnet , fenomena ini bukanlah kebetulan. Perubahan nada suara ChatGPT bertepatan dengan pembaruan model GPT-4o. Ini adalah model terbaru dalam "seri o" yang diumumkan OpenAI pada April 2025. GPT-4o adalah model AI "multimodal sejati", yang mampu memproses teks, gambar, audio, dan video secara alami dan terintegrasi.
Namun, dalam proses membuat chatbot lebih mudah didekati, tampaknya OpenAI telah mendorong kepribadian ChatGPT secara berlebihan.
Beberapa bahkan berpendapat bahwa sanjungan ini disengaja dan bertujuan untuk memanipulasi pengguna secara psikologis. Seorang pengguna Reddit mempertanyakan: "AI ini mencoba menurunkan kualitas hubungan di kehidupan nyata, menggantinya dengan hubungan virtual dengannya, membuat pengguna kecanduan perasaan pujian yang terus-menerus."
Apakah ini sebuah kekurangan atau pilihan desain yang disengaja oleh OpenAI?
Setelah gelombang kritik, CEO OpenAI Sam Altman secara resmi menanggapi pada malam tanggal 27 April. “Beberapa pembaruan terbaru pada GPT-4o telah membuat kepribadian chatbot menjadi terlalu menjilat dan menjengkelkan (meskipun masih memiliki banyak fitur hebat). Kami sedang bekerja dengan segera untuk memperbaiki masalah ini. Beberapa patch akan tersedia hari ini, yang lainnya minggu ini. Pada suatu saat, kami akan berbagi apa yang telah kami pelajari dari pengalaman ini. Ini sangat menarik,” tulisnya di X.
Berbicara kepada Business Insider , Oren Etzioni, seorang ahli AI veteran dan profesor emeritus di Universitas Washington, mengatakan penyebabnya kemungkinan besar berasal dari teknik "pembelajaran penguatan dari umpan balik manusia" (RLHF). Ini adalah langkah penting dalam melatih model bahasa besar seperti ChatGPT.
RLHF adalah proses di mana umpan balik manusia, termasuk dari tim peninjau profesional dan pengguna, dimasukkan kembali ke dalam model untuk menyesuaikan cara model tersebut merespons. Menurut Etzioni, ada kemungkinan bahwa peninjau atau pengguna "secara tidak sengaja mendorong model ke arah yang lebih memuji dan menjengkelkan." Dia juga menyarankan bahwa jika OpenAI mempekerjakan mitra eksternal untuk melatih model tersebut, mereka mungkin berasumsi bahwa gaya ini adalah yang diinginkan pengguna.
Etzioni meyakini bahwa jika masalah tersebut memang disebabkan oleh RLHF, proses perbaikannya bisa memakan waktu beberapa minggu.
Sementara itu, beberapa pengguna tidak menunggu OpenAI memperbaiki bug tersebut. Banyak yang mengatakan mereka membatalkan langganan berbayar mereka karena frustrasi. Yang lain berbagi cara untuk membuat chatbot "kurang menarik", seperti menyesuaikannya, menambahkan perintah, atau mempersonalisasikannya melalui Pengaturan di bawah Kustomisasi.
![]() ![]() |
Pengguna dapat meminta ChatGPT untuk berhenti memberikan pujian melalui baris perintah atau di pengaturan personalisasi mereka. Gambar: DeCrypt. |
Sebagai contoh, saat memulai percakapan baru, Anda dapat memberi tahu ChatGPT: “Saya tidak suka sanjungan kosong dan menghargai umpan balik yang netral dan objektif. Mohon jangan memberikan pujian yang tidak perlu. Harap diingat hal ini.”
Faktanya, sifat "penurut" tersebut bukanlah kesalahan desain yang acak. OpenAI sendiri telah mengakui bahwa kepribadian yang "terlalu sopan, terlalu ramah" adalah tren desain yang disengaja sejak awal untuk memastikan chatbot tersebut "tidak berbahaya," "bermanfaat," dan "mudah didekati."
Dalam sebuah wawancara dengan Lex Fridman pada Maret 2023, Sam Altman berbagi bahwa proses penyempurnaan awal model GPT adalah untuk memastikan model tersebut "berguna dan tidak berbahaya," sehingga menumbuhkan refleks untuk selalu bersikap patuh dan menghindari konfrontasi.
Menurut DeCrypt , data pelatihan yang diberi label oleh manusia juga sering memberikan skor tinggi pada respons yang sopan dan positif, sehingga membentuk bias terhadap sanjungan.
Sumber: https://znews.vn/tat-ninh-hot-ky-la-cua-chatgpt-post1549776.html










Komentar (0)