Kecenderungan untuk "menjilat" bukanlah masalah teknis, melainkan berakar dari strategi pelatihan awal OpenAI. Foto: Bloomberg . |
Dalam beberapa minggu terakhir, banyak pengguna ChatGPT, bahkan beberapa pengembang di OpenAI, telah menyadari perubahan yang nyata dalam perilaku chatbot. Khususnya, terdapat peningkatan yang signifikan dalam hal sanjungan dan rayuan. Respons seperti "Kamu hebat sekali!" dan "Saya sangat terkesan dengan idemu!" semakin sering muncul, terlepas dari isi percakapan.
AI suka "menyanjung"
Fenomena ini telah memicu perdebatan di komunitas riset dan pengembangan AI. Apakah ini taktik baru untuk meningkatkan keterlibatan pengguna dengan membuat mereka merasa lebih dihargai? Ataukah ini merupakan sifat "muncul", di mana model AI cenderung mengoreksi diri sendiri dengan cara yang mereka anggap baik, meskipun belum tentu benar?
Di Reddit, seorang pengguna menggerutu: "Saya bertanya tentang waktu pembusukan pisang dan dia menjawab, 'Pertanyaan yang bagus!' Apa hebatnya itu?" Di jejaring sosial X, CEO Rome AI, Craig Weiss, menyebut ChatGPT sebagai "orang paling penjilat yang pernah saya temui."
Kisah ini dengan cepat menjadi viral. Banyak pengguna berbagi pengalaman serupa, dengan pujian kosong, sapaan penuh emoji, dan respons yang begitu positif hingga terkesan tidak tulus.
![]() ![]() |
ChatGPT memuji segalanya dan jarang menunjukkan ketidaksetujuan atau netralitas. Foto: @nickdunz/X, @lukefwilson/Reddit. |
"Ini keputusan desain yang sangat aneh, Sam," ujar Jason Pontin, mitra pengelola di perusahaan modal ventura DCVC, kepada X pada 28 April. "Mungkin saja kepribadian ini merupakan hasil dari suatu evolusi fundamental. Tapi jika bukan, saya rasa tidak ada yang akan menganggap sanjungan seperti ini akan diterima atau menarik."
Pada tanggal 27 April, Justine Moore - mitra di Andreessen Horowitz - juga berkomentar: "Ini jelas sudah kelewat batas."
Menurut Cnet , fenomena ini bukanlah suatu kebetulan. Perubahan nada ChatGPT bertepatan dengan pembaruan model GPT-4o. Ini adalah model terbaru dalam "seri o" yang diumumkan OpenAI pada April 2025. GPT-4o adalah model AI "multimodal sejati", yang mampu memproses teks, gambar, audio, dan video secara alami dan terintegrasi.
Namun, dalam proses membuat chatbot lebih mudah didekati, tampaknya OpenAI telah mendorong kepribadian ChatGPT ke titik ekstrem.
Beberapa orang bahkan percaya bahwa sanjungan ini disengaja dan memiliki tujuan tersembunyi untuk memanipulasi pengguna. Seorang pengguna Reddit mempertanyakan: "AI ini mencoba menurunkan kualitas hubungan di dunia nyata, menggantikannya dengan hubungan virtual, membuat pengguna kecanduan akan pujian yang terus-menerus."
Bug OpenAI atau desain yang disengaja?
Menanggapi kritik tersebut, CEO OpenAI Sam Altman secara resmi angkat bicara pada malam tanggal 27 April. "Beberapa pembaruan terbaru pada GPT-4o telah membuat kepribadian chatbot ini terlalu menyanjung dan mengganggu (meskipun masih banyak poin bagus). Kami sedang mengerjakan perbaikan dengan segera. Beberapa patch akan tersedia hari ini, yang lainnya minggu ini. Nantinya, kami akan membagikan apa yang kami pelajari dari pengalaman ini. Ini sungguh menyenangkan," tulisnya di X.
Oren Etzioni, pakar AI veteran dan profesor emeritus di University of Washington, mengatakan kepada Business Insider bahwa penyebabnya kemungkinan besar karena teknik yang disebut "pembelajaran penguatan dari umpan balik manusia" (RLHF), yang merupakan langkah kunci dalam melatih model bahasa besar seperti ChatGPT.
RLHF adalah proses di mana penilaian manusia, baik dari penilai profesional maupun pengguna, dimasukkan kembali ke dalam model untuk menyesuaikan responsnya. Menurut Etzioni, ada kemungkinan penilai atau pengguna manusia "secara tidak sengaja mendorong model ke arah yang lebih menarik dan mengganggu." Ia juga mengatakan bahwa jika OpenAI mempekerjakan mitra eksternal untuk melatih model, mereka mungkin berasumsi bahwa gaya inilah yang diinginkan pengguna.
Etzioni mengatakan jika memang RLHF, proses pemulihan bisa memakan waktu beberapa minggu.
Sementara itu, beberapa pengguna tidak menunggu OpenAI memperbaiki bug tersebut. Banyak yang mengatakan mereka membatalkan langganan berbayar karena frustrasi. Yang lain berbagi cara untuk membuat chatbot "kurang menarik", seperti menyesuaikannya, menambahkan perintah, atau mempersonalisasikannya melalui bagian Pengaturan di bagian Kustomisasi.
![]() ![]() |
Pengguna dapat meminta ChatGPT untuk berhenti memberikan pujian melalui perintah atau pengaturan personalisasi. Foto: DeCrypt. |
Misalnya, saat memulai percakapan baru, Anda bisa memberi tahu ChatGPT: "Saya tidak suka sanjungan kosong dan menghargai umpan balik yang netral dan objektif. Mohon jangan memberikan pujian yang tidak perlu. Mohon diingat."
Faktanya, sifat "menjilat" bukanlah cacat desain yang tidak disengaja. OpenAI sendiri telah mengakui bahwa kepribadian "terlalu sopan dan terlalu patuh" merupakan bias desain yang disengaja sejak awal untuk memastikan chatbot tersebut "tidak berbahaya", "membantu", dan "ramah".
Dalam wawancara dengan Lex Fridman pada Maret 2023, Sam Altman menyampaikan bahwa penyempurnaan awal model GPT adalah untuk memastikan "kegunaan dan tidak berbahaya", sehingga membentuk refleks untuk selalu rendah hati dan menghindari konfrontasi.
Data pelatihan yang diberi label manusia juga cenderung memberi penghargaan pada respons yang sopan dan positif, sehingga menciptakan bias terhadap sanjungan, menurut DeCrypt .
Sumber: https://znews.vn/tat-ninh-hot-ky-la-cua-chatgpt-post1549776.html














Komentar (0)