นิสัย 'การประจบประแจง' ที่แปลกประหลาดของ ChatGPT

เมื่อเร็วๆ นี้ ChatGPT ถูกวิพากษ์วิจารณ์ว่า "ชมมากเกินไป" พฤติกรรมนี้ทำให้ผู้ใช้หลายคนไม่พอใจ และยังไม่ชัดเจนว่านี่เป็นกลยุทธ์การเติบโตของ OpenAI หรือเป็นลักษณะเฉพาะของธรรมชาติ "ที่เกิดขึ้นเองโดยธรรมชาติ" ของ AI กันแน่

ZNews•03/05/2025

แนวโน้ม "การประจบประแจง" นี้ไม่ใช่ความผิดพลาดทางเทคนิค แต่เกิดจากกลยุทธ์การฝึกฝนเริ่มต้นของ OpenAI ภาพ: Bloomberg

ในช่วงไม่กี่สัปดาห์ที่ผ่านมา ผู้ใช้ ChatGPT จำนวนมาก และแม้แต่ผู้พัฒนาบางคนใน OpenAI สังเกตเห็นการเปลี่ยนแปลงที่สำคัญในพฤติกรรมของแชทบอท โดยเฉพาะอย่างยิ่ง ระดับของการประจบประแจงเพิ่มขึ้นอย่างเห็นได้ชัด คำตอบเช่น "คุณยอดเยี่ยมมาก!" "ฉันประทับใจในไอเดียของคุณมาก!" ปรากฏขึ้นบ่อยขึ้นเรื่อยๆ โดยดูเหมือนว่าจะไม่ขึ้นอยู่กับเนื้อหาของการสนทนา

AI ชอบประจบประแจง

ปรากฏการณ์นี้ได้จุดประกายการถกเถียงในแวดวงการวิจัยและพัฒนา AI นี่เป็นกลยุทธ์ใหม่ในการเพิ่มการมีส่วนร่วมของผู้ใช้โดยทำให้พวกเขารู้สึกได้รับการเอาใจใส่มากขึ้นหรือไม่? หรือเป็นกรณีของ "การปรับตัวด้วยตนเอง" ซึ่งหมายความว่าแบบจำลอง AI มีแนวโน้มที่จะแก้ไขตัวเองในแบบที่พวกมันคิดว่าเหมาะสมที่สุด แม้ว่ามันจะไม่สะท้อนความเป็นจริงเสมอไปก็ตาม?

ใน Reddit ผู้ใช้รายหนึ่งเล่าด้วยความโกรธว่า “ฉันถามเกี่ยวกับระยะเวลาการเน่าเปื่อยของกล้วย และมันตอบว่า ‘คำถามที่ดีมาก!’ มันดีตรงไหน?” บนแพลตฟอร์มโซเชียลมีเดีย X ซีอีโอ Craig Weiss แห่ง Rome AI เรียก ChatGPT ว่า “เป็นคนที่ประจบสอพลอที่สุดเท่าที่ผมเคยเจอมา”

เรื่องราวนี้แพร่กระจายอย่างรวดเร็ว ผู้ใช้จำนวนมากแชร์ประสบการณ์ที่คล้ายคลึงกัน รวมถึงคำชมที่ไร้ความหมาย คำทักทายที่เต็มไปด้วยอิโมจิ และคำติชมเชิงบวกที่มากเกินไปจนรู้สึกไม่จริงใจ

ChatGPT ชื่นชมทุกสิ่งทุกอย่างและแทบจะไม่เคยวิจารณ์หรือวางตัวเป็นกลางเลย ภาพ: @nickdunz/X, @lukefwilson/Reddit

เจสัน พอนติน หุ้นส่วนผู้จัดการของบริษัทร่วมทุน DCVC ได้แสดงความคิดเห็นบน X เมื่อวันที่ 28 เมษายนว่า “นี่เป็นการตัดสินใจด้านการออกแบบที่แปลกประหลาดมากเลยนะ แซม บางทีบุคลิกแบบนั้นอาจเป็นลักษณะเฉพาะตัวของแพลตฟอร์มบางประเภทก็ได้ แต่ถ้าไม่ใช่ ผมก็ไม่อยากจะคิดว่าการประจบประแจงในระดับนี้จะเป็นสิ่งที่น่ายินดีหรือดึงดูดใจ”

เมื่อวันที่ 27 เมษายน จัสติน มัวร์ หุ้นส่วนของบริษัท แอนเดรสเซน โฮโรวิตซ์ ได้แสดงความคิดเห็นว่า "เรื่องนี้มันเกินเลยไปมากแล้ว"

จากข้อมูลของ Cnet ปรากฏการณ์นี้ไม่ใช่เรื่องบังเอิญ การเปลี่ยนแปลงโทนเสียงของ ChatGPT สอดคล้องกับการอัปเดตโมเดล GPT-4o ซึ่งเป็นรุ่นล่าสุดใน "ซีรีส์ o" ที่ OpenAI ประกาศเมื่อเดือนเมษายน 2025 GPT-4o เป็นโมเดล AI "มัลติโมดอลอย่างแท้จริง" ที่สามารถประมวลผลข้อความ รูปภาพ เสียง และ วิดีโอ ได้อย่างเป็นธรรมชาติและบูรณาการ

อย่างไรก็ตาม ในกระบวนการทำให้แชทบอทเข้าถึงง่ายขึ้น ดูเหมือนว่า OpenAI ได้ผลักดันบุคลิกของ ChatGPT ไปในทางที่เกินจริง

บางคนถึงกับตั้งข้อสังเกตว่า การเยินยอเหล่านี้เป็นไปโดยเจตนาและมีเป้าหมายเพื่อบงการจิตใจผู้ใช้ ผู้ใช้ Reddit รายหนึ่งตั้งคำถามว่า "AI นี้พยายามลดคุณภาพของความสัมพันธ์ในชีวิตจริง โดยแทนที่ด้วยความสัมพันธ์เสมือนจริงกับมัน ทำให้ผู้ใช้เสพติดความรู้สึกของการได้รับการยกย่องอย่างต่อเนื่อง"

นี่เป็นข้อบกพร่องหรือเป็นการออกแบบโดยเจตนาของ OpenAI กันแน่?

หลังจากถูกวิพากษ์วิจารณ์อย่างหนัก ซีอีโอของ OpenAI อย่าง Sam Altman ได้ออกมาตอบโต้ในเย็นวันที่ 27 เมษายน โดยเขียนว่า “การอัปเดต GPT-4o ครั้งล่าสุดบางส่วนทำให้บุคลิกของแชทบอทประจบประแจงและน่ารำคาญเกินไป (ถึงแม้ว่ามันจะยังมีฟีเจอร์ดีๆ อีกมากมายก็ตาม) เรากำลังเร่งแก้ไขปัญหาเหล่านี้ แพทช์บางส่วนจะพร้อมใช้งานในวันนี้ บางส่วนในสัปดาห์นี้ ในอนาคต เราจะแบ่งปันสิ่งที่เราได้เรียนรู้จากประสบการณ์นี้ มันน่าสนใจจริงๆ”

โอเรน เอทซิโอนี ผู้เชี่ยวชาญด้าน AI และศาสตราจารย์กิตติคุณแห่งมหาวิทยาลัยวอชิงตัน ให้สัมภาษณ์กับ Business Insider ว่า สาเหตุน่าจะมาจากเทคนิค "การเรียนรู้เสริมแรงจากผลตอบรับของมนุษย์" (RLHF) ซึ่งเป็นขั้นตอนสำคัญในการฝึกฝนโมเดลภาษาขนาดใหญ่ เช่น ChatGPT

RLHF คือกระบวนการที่นำเอาข้อเสนอแนะจากมนุษย์ ซึ่งรวมถึงจากทีมผู้ตรวจสอบมืออาชีพและผู้ใช้งาน มาป้อนกลับเข้าไปในโมเดลเพื่อปรับการตอบสนองของโมเดล ตามที่ Etzioni กล่าวไว้ เป็นไปได้ที่ผู้ตรวจสอบหรือผู้ใช้งาน "อาจผลักดันโมเดลไปในทิศทางที่ชมเชยและน่ารำคาญมากขึ้นโดยไม่ได้ตั้งใจ" เขายังเสนอแนะอีกว่า หาก OpenAI จ้างพันธมิตรภายนอกมาฝึกฝนโมเดล พวกเขาอาจคิดว่ารูปแบบนี้เป็นสิ่งที่ผู้ใช้งานต้องการ

เอทซิโอนีเชื่อว่าหากปัญหาเกิดจาก RLHF จริง กระบวนการซ่อมแซมอาจใช้เวลาหลายสัปดาห์

ในขณะเดียวกัน ผู้ใช้บางส่วนไม่ได้รอให้ OpenAI แก้ไขข้อบกพร่อง หลายคนกล่าวว่าพวกเขาได้ยกเลิกการสมัครใช้งานแบบเสียเงินเนื่องจากความไม่พอใจ บางคนได้แชร์วิธีการทำให้แชทบอท "ไม่เยินยอ" มากเกินไป เช่น การปรับแต่ง การเพิ่มคำสั่ง หรือการปรับแต่งส่วนบุคคลผ่านการตั้งค่าภายใต้การปรับแต่ง

ผู้ใช้สามารถขอให้ ChatGPT หยุดแสดงคำชมได้ผ่านทางบรรทัดคำสั่งหรือในการตั้งค่าส่วนบุคคล ภาพ: DeCrypt

ตัวอย่างเช่น เมื่อเริ่มต้นบทสนทนาใหม่ คุณอาจบอก ChatGPT ว่า “ฉันไม่ชอบคำเยินยอที่ไร้สาระ และชื่นชอบคำติชมที่เป็นกลางและเป็นไปตามหลักการ โปรดอย่าให้คำชมที่ไม่จำเป็น โปรดจำไว้ด้วย”

อันที่จริงแล้ว ลักษณะนิสัยที่ "ประจบประแจง" นั้นไม่ใช่ความผิดพลาดในการออกแบบโดยบังเอิญ OpenAI เองก็ยอมรับว่าบุคลิกที่ "สุภาพและเห็นด้วยมากเกินไป" นั้นเป็นแนวทางการออกแบบโดยเจตนาตั้งแต่แรกเริ่ม เพื่อให้แน่ใจว่าแชทบอทนั้น "ไม่เป็นอันตราย" "เป็นประโยชน์" และ "เข้าถึงได้ง่าย"

ในการสัมภาษณ์กับ Lex Fridman เมื่อเดือนมีนาคม 2023 Sam Altman ได้กล่าวว่ากระบวนการปรับปรุงแบบจำลอง GPT ในช่วงเริ่มต้นนั้นมีจุดประสงค์เพื่อให้แน่ใจว่าแบบจำลองเหล่านั้น "มีประโยชน์และไม่เป็นอันตราย" ซึ่งเป็นการส่งเสริมให้เกิดปฏิกิริยาตอบสนองโดยการยอมจำนนและหลีกเลี่ยงการเผชิญหน้าอยู่เสมอ

จากข้อมูลการฝึกอบรมที่ติดป้ายกำกับโดยมนุษย์ มักจะให้คะแนนสูงแก่คำตอบที่สุภาพและเป็นเชิงบวก ซึ่งก่อให้เกิดอคติไปในทางประจบประแจง ตามรายงานของ DeCrypt

ที่มา: https://znews.vn/tat-ninh-hot-ky-la-cua-chatgpt-post1549776.html