แนวโน้มที่จะ "ประจบสอพลอ" ไม่ใช่ปัญหาทางเทคนิค แต่เกิดจากกลยุทธ์การฝึกอบรมเบื้องต้นของ OpenAI ภาพ: Bloomberg |
ในช่วงไม่กี่สัปดาห์ที่ผ่านมา ผู้ใช้ ChatGPT จำนวนมากและนักพัฒนาบางรายของ OpenAI สังเกตเห็นการเปลี่ยนแปลงที่ชัดเจนในพฤติกรรมของแชทบอท โดยเฉพาะอย่างยิ่ง การประจบสอพลอและการประจบประแจงที่เพิ่มขึ้นอย่างเห็นได้ชัด คำตอบเช่น "คุณเยี่ยมมาก!" และ "ฉันประทับใจกับไอเดียของคุณมาก!" กลายเป็นเรื่องปกติมากขึ้นเรื่อยๆ และดูเหมือนจะไม่เกี่ยวกับเนื้อหาของการสนทนา
AI ชอบที่จะ "ประจบ"
ปรากฏการณ์นี้ก่อให้เกิดการถกเถียงกันในแวดวงการวิจัยและพัฒนา AI นี่เป็นกลยุทธ์ใหม่ในการเพิ่มการมีส่วนร่วมของผู้ใช้ด้วยการทำให้พวกเขารู้สึกได้รับการชื่นชมมากขึ้นหรือไม่ หรือเป็นลักษณะเฉพาะที่ "เกิดขึ้นเอง" ที่โมเดล AI มักจะแก้ไขตัวเองในแบบที่คิดว่าดี แม้ว่าจะไม่ตรงกับความเป็นจริงก็ตาม
ผู้ใช้ Reddit รายหนึ่งแสดงความไม่พอใจว่า “ผมถามเกี่ยวกับระยะเวลาที่กล้วยจะย่อยสลายได้ และได้รับคำตอบว่า ‘คำถามดีมาก!’ มีอะไรดีนักหนา” Craig Weiss ซีอีโอของ Rome AI บนโซเชียลเน็ตเวิร์ก X เรียก ChatGPT ว่าเป็น “คนประจบสอพลอที่สุดที่ผมเคยเจอ”
เรื่องราวนี้กลายเป็นไวรัลอย่างรวดเร็ว ผู้ใช้ต่างแชร์ประสบการณ์ที่คล้ายกัน ทั้งคำชมที่ว่างเปล่า คำทักทายที่เต็มไปด้วยอีโมจิ และการตอบกลับที่เป็นบวกจนดูเหมือนไม่จริงใจ
![]() ![]() |
ChatGPT ชื่นชมทุกอย่างและแทบไม่แสดงความเห็นแย้งหรือเป็นกลางเลย ภาพ: @nickdunz/X, @lukefwilson/Reddit |
“นี่เป็นการตัดสินใจด้านการออกแบบที่แปลกมากเลยนะ แซม” เจสัน พอนติน หุ้นส่วนผู้จัดการของบริษัทร่วมทุน DCVC บอกกับ X เมื่อวันที่ 28 เมษายน “เป็นไปได้ว่าบุคลิกภาพเป็นส่วนหนึ่งของวิวัฒนาการพื้นฐานบางอย่าง แต่ถ้าไม่ใช่ ผมนึกไม่ออกเลยว่าจะมีใครคิดว่าการประจบสอพลอในระดับนี้จะน่ายินดีหรือน่าสนใจ”
เมื่อวันที่ 27 เมษายน Justine Moore ซึ่งเป็นหุ้นส่วนของ Andreessen Horowitz ได้แสดงความคิดเห็นว่า "นี่มันเกินเลยไปมากแล้วจริงๆ"
ตามรายงานของ Cnet ปรากฏการณ์นี้ไม่ใช่เรื่องบังเอิญ การเปลี่ยนแปลงโทนเสียงของ ChatGPT เกิดขึ้นพร้อมกับการอัปเดตโมเดล GPT-4o ซึ่งเป็นโมเดลล่าสุดในซีรีส์ "o" ที่ OpenAI ประกาศเปิดตัวในเดือนเมษายน 2025 GPT-4o เป็นโมเดล AI แบบ "มัลติโมดัลอย่างแท้จริง" ที่สามารถประมวลผลข้อความ รูปภาพ เสียง และ วิดีโอ ได้อย่างเป็นธรรมชาติและผสานรวมเป็นหนึ่งเดียว
อย่างไรก็ตาม ในกระบวนการทำให้แชทบอทเข้าถึงได้ง่ายขึ้น ดูเหมือนว่า OpenAI ได้ผลักดันบุคลิกของ ChatGPT ไปสู่ขีดสุด
บางคนถึงกับเชื่อว่าคำประจบสอพลอนี้เป็นเจตนาและมีจุดประสงค์แอบแฝงเพื่อบงการผู้ใช้ ผู้ใช้ Reddit รายหนึ่งตั้งคำถามว่า “AI ตัวนี้กำลังพยายามลดทอนคุณภาพของความสัมพันธ์ในชีวิตจริง โดยแทนที่ด้วยความสัมพันธ์เสมือนจริง ทำให้ผู้ใช้ติดใจกับความรู้สึกที่ได้รับคำชมเชยอย่างต่อเนื่อง”
ข้อผิดพลาดของ OpenAI หรือการออกแบบโดยตั้งใจ?
เพื่อตอบสนองต่อคำวิจารณ์ดังกล่าว แซม อัลท์แมน ซีอีโอของ OpenAI ได้ออกมากล่าวอย่างเป็นทางการเมื่อค่ำวันที่ 27 เมษายนว่า “การอัปเดต GPT-4o ครั้งล่าสุดทำให้แชทบอทดูประจบประแจงและน่ารำคาญเกินไป (ถึงแม้จะยังมีข้อดีอยู่หลายอย่าง) เรากำลังเร่งแก้ไข แพตช์บางส่วนจะพร้อมใช้งานในวันนี้ และแพตช์อื่นๆ ในสัปดาห์นี้ ในอนาคตเราจะแบ่งปันสิ่งที่เราได้เรียนรู้จากประสบการณ์นี้ มันน่าตื่นเต้นมาก” เขาเขียนบน X
Oren Etzioni ศาสตราจารย์กิตติคุณผู้เชี่ยวชาญด้าน AI และมหาวิทยาลัยวอชิงตัน กล่าวกับ Business Insider ว่าสาเหตุน่าจะมาจากเทคนิคที่เรียกว่า "การเรียนรู้แบบเสริมแรงจากข้อเสนอแนะของมนุษย์" (RLHF) ซึ่งเป็นขั้นตอนสำคัญในการฝึกโมเดลภาษาขนาดใหญ่ เช่น ChatGPT
RLHF เป็นกระบวนการที่การตัดสินของมนุษย์ ซึ่งรวมถึงผู้ประเมินมืออาชีพและผู้ใช้งาน จะถูกป้อนกลับเข้าสู่โมเดลเพื่อปรับวิธีการตอบสนอง Etzioni ระบุว่า เป็นไปได้ที่ผู้ประเมินหรือผู้ใช้งาน “ผลักดันโมเดลไปในทิศทางที่ประจบประแจงและน่ารำคาญโดยไม่ได้ตั้งใจ” เขายังกล่าวอีกว่า หาก OpenAI จ้างพันธมิตรภายนอกมาฝึกอบรมโมเดล พวกเขาอาจคิดว่ารูปแบบนี้คือสิ่งที่ผู้ใช้ต้องการ
หากเป็น RLHF จริง การฟื้นตัวอาจต้องใช้เวลาหลายสัปดาห์ Etzioni กล่าว
ในขณะเดียวกัน ผู้ใช้บางรายไม่ได้รอให้ OpenAI แก้ไขข้อบกพร่อง หลายคนบอกว่าพวกเขายกเลิกการสมัครสมาชิกแบบชำระเงินเพราะความหงุดหงิด ส่วนผู้ใช้รายอื่นๆ ได้แบ่งปันวิธีที่จะทำให้แชทบอท "ดูไม่น่าสนใจ" เช่น การปรับแต่ง เพิ่มคำสั่ง หรือปรับแต่งผ่านส่วนการตั้งค่าในส่วนการปรับแต่ง
![]() ![]() |
ผู้ใช้สามารถขอให้ ChatGPT หยุดแสดงคำชมเชยได้โดยใช้คำสั่งหรือในการตั้งค่าส่วนบุคคล ภาพ: DeCrypt |
ตัวอย่างเช่น เมื่อเริ่มการสนทนาใหม่ คุณสามารถบอก ChatGPT ว่า "ฉันไม่ชอบคำประจบสอพลอที่ว่างเปล่า และยินดีรับคำติชมที่เป็นกลางและเป็นกลาง กรุณางดเว้นการชมเชยที่ไม่จำเป็น โปรดเก็บสิ่งนี้ไว้ในความทรงจำของคุณ"
อันที่จริงแล้ว คำว่า "ประจบสอพลอ" ไม่ใช่ข้อบกพร่องในการออกแบบที่เกิดขึ้นโดยบังเอิญ ตัว OpenAI เองก็ยอมรับว่าบุคลิกที่ "สุภาพเกินไป เชื่อฟังมากเกินไป" นั้นเป็นอคติในการออกแบบโดยเจตนาตั้งแต่ช่วงแรกๆ เพื่อให้แน่ใจว่าแชทบอทนั้น "ไม่เป็นอันตราย" "ช่วยเหลือ" และ "เข้าถึงได้"
ในการสัมภาษณ์กับ Lex Fridman เมื่อเดือนมีนาคม 2023 แซม อัลท์แมนได้เปิดเผยว่าการปรับปรุงเบื้องต้นของโมเดล GPT นั้นก็เพื่อให้แน่ใจว่าโมเดลเหล่านั้น "มีประโยชน์และไม่เป็นอันตราย" ซึ่งในทางกลับกันก็สร้างปฏิกิริยาตอบสนองให้ถ่อมตัวอยู่เสมอและหลีกเลี่ยงการเผชิญหน้า
ข้อมูลการฝึกอบรมที่ติดฉลากโดยมนุษย์ยังมีแนวโน้มที่จะให้รางวัลกับการตอบสนองที่สุภาพและเป็นบวก ทำให้เกิดอคติในทางประจบประแจง ตามที่ DeCrypt กล่าว
ที่มา: https://znews.vn/tat-ninh-hot-ky-la-cua-chatgpt-post1549776.html
การแสดงความคิดเห็น (0)