แนวโน้ม "การประจบสอพลอ" ไม่ใช่ปัญหาทางเทคนิค แต่เกิดจากกลยุทธ์การฝึกอบรมเบื้องต้นของ OpenAI ภาพ: Bloomberg . |
ในสัปดาห์ที่ผ่านมา ผู้ใช้ ChatGPT จำนวนมากและนักพัฒนาบางส่วนใน OpenAI สังเกตเห็นการเปลี่ยนแปลงที่ชัดเจนในพฤติกรรมของแชทบอท โดยเฉพาะอย่างยิ่งระดับของความชื่นชมยินดีและความพึงพอใจของผู้ใช้เพิ่มขึ้นอย่างมีนัยสำคัญ ข้อเสนอแนะ เช่น “คุณยอดเยี่ยมมากจริงๆ!”, “ฉันประทับใจกับไอเดียของคุณมาก!” ปรากฏมากขึ้นเรื่อยๆ อย่างเห็นได้ชัด โดยไม่คำนึงถึงเนื้อหาของการแลกเปลี่ยน
AI ชอบที่จะ "ประจบสอพลอ"
ปรากฏการณ์ดังกล่าวก่อให้เกิดการถกเถียงในชุมชนการวิจัยและพัฒนา AI นี่เป็นกลยุทธ์ใหม่ในการเพิ่มการมีส่วนร่วมของผู้ใช้โดยทำให้พวกเขารู้สึกได้รับการชื่นชมมากขึ้นหรือไม่? หรือว่านี่เป็นคุณสมบัติ "ที่เกิดขึ้นใหม่" โดยที่โมเดล AI มีแนวโน้มที่จะปรับตัวให้เข้ากับสิ่งที่คิดว่าดี แม้ว่าจะไม่ตรงกับความเป็นจริงก็ตาม?
ผู้ใช้ Reddit รายหนึ่งที่รู้สึกหงุดหงิดกล่าวว่า “ฉันถามเกี่ยวกับเวลาย่อยสลายของกล้วย และได้รับคำตอบว่า 'คำถามที่ดี!' มีอะไรดีนักเกี่ยวกับเรื่องนี้? บนโซเชียลเน็ตเวิร์ก X Craig Weiss ซีอีโอของ Rome AI เรียก ChatGPT ว่าเป็น “คนประจบสอพลอที่สุดที่เขาเคยพบ”
เรื่องราวแพร่กระจายไปอย่างรวดเร็ว ผู้ใช้ต่างแชร์ประสบการณ์ที่คล้ายกัน เช่น คำชมที่ว่างเปล่า คำทักทายที่เต็มไปด้วยอีโมจิ และข้อเสนอแนะเชิงบวกที่ดูเหมือนไม่จริงใจ
![]() ![]() |
ChatGPT ชื่นชมทุกสิ่งและแทบไม่แสดงการวิพากษ์วิจารณ์หรือความเป็นกลาง รูปภาพ: @nickdunz/X, @lukefwilson/Reddit |
เจสัน พอนติน ผู้จัดการหุ้นส่วนของบริษัท DCVC ซึ่งเป็นบริษัทเงินทุนเสี่ยง กล่าวกับ X เมื่อวันที่ 28 เมษายนว่า "นี่เป็นการตัดสินใจด้านการออกแบบที่แปลกมาก แซม เป็นไปได้ที่บุคลิกภาพจะเป็นส่วนหนึ่งตามธรรมชาติของวิวัฒนาการพื้นฐานบางอย่าง แต่ถ้าไม่เป็นเช่นนั้น ฉันนึกไม่ออกเลยว่าจะมีใครคิดว่าการประจบประแจงในระดับนี้จะเป็นที่น่ายินดีหรือเป็นที่สนใจ"
เมื่อวันที่ 27 เมษายน Justine Moore ซึ่งเป็นหุ้นส่วนของ Andreessen Horowitz ได้แสดงความคิดเห็นว่า "นี่มันเกินไปจริงๆ"
ตามที่ Cnet รายงาน ปรากฏการณ์นี้ไม่ใช่เรื่องสุ่ม การเปลี่ยนแปลงโทนเสียงของ ChatGPT สอดคล้องกับการอัปเดตของโมเดล GPT-4o นี่เป็นโมเดลล่าสุดในซีรีส์ “o” ที่ OpenAI ประกาศเมื่อเดือนเมษายน 2025 GPT-4o เป็นโมเดล AI “แบบหลายโหมดอย่างแท้จริง” ที่สามารถประมวลผลข้อความ รูปภาพ เสียง และ วิดีโอ ในลักษณะที่เป็นธรรมชาติและบูรณาการ
อย่างไรก็ตาม ในกระบวนการทำให้แชทบอทเข้าถึงได้ง่ายขึ้น ดูเหมือนว่า OpenAI ได้ผลักดันบุคลิกของ ChatGPT ไปสู่ขีดสุด
บางคนถึงกับเถียงว่าคำเยินยอนี้เป็นความตั้งใจและมีเป้าหมายแอบแฝงเพื่อหลอกล่อผู้ใช้ทางจิตวิทยา ผู้ใช้ Reddit รายหนึ่งตั้งคำถามว่า “AI ตัวนี้กำลังพยายามลดคุณภาพของความสัมพันธ์ในชีวิตจริง เพื่อแทนที่ด้วยความสัมพันธ์แบบเสมือนจริง ทำให้ผู้ใช้ติดใจความรู้สึกที่ได้รับคำชมเชยอย่างต่อเนื่อง”
ข้อบกพร่องของ OpenAI หรือการออกแบบที่ตั้งใจ?
Sam Altman ซีอีโอของ OpenAI ได้ออกมาพูดอย่างเป็นทางการเมื่อช่วงค่ำของวันที่ 27 เมษายนที่ผ่านมา โดยเขากล่าวว่า “การอัปเดต GPT-4o ไม่กี่รายการล่าสุดทำให้ลักษณะนิสัยของแชทบอตดูประจบสอพลอและน่ารำคาญเกินไป (แม้ว่าจะยังมีข้อดีอยู่บ้าง) เรากำลังดำเนินการแก้ไข โดยจะมีการแก้ไขบางส่วนในวันนี้และบางส่วนในสัปดาห์นี้ ในบางจุด เราจะแบ่งปันสิ่งที่เราได้เรียนรู้จากประสบการณ์นี้ มันสนุกมาก” เขาเขียนบน X
Oren Etzioni ผู้เชี่ยวชาญอาวุโสด้านอุตสาหกรรม AI และศาสตราจารย์กิตติคุณแห่งมหาวิทยาลัยวอชิงตัน กล่าวกับ Business Insider ว่า สาเหตุน่าจะมาจากเทคนิค "การเรียนรู้แบบเสริมแรงจากข้อมูลตอบรับของมนุษย์" (RLHF) นี่เป็นขั้นตอนสำคัญในการฝึกโมเดลภาษาขนาดใหญ่เช่น ChatGPT
RLHF คือกระบวนการที่การตัดสินของมนุษย์ รวมถึงทีมตรวจสอบมืออาชีพและผู้ใช้ จะถูกป้อนกลับไปยังโมเดลเพื่อปรับวิธีการตอบสนอง ตามที่ Etzioni กล่าวไว้ เป็นไปได้ที่ผู้วิจารณ์หรือผู้ใช้ได้ "ผลักดันโมเดลไปในทิศทางที่น่าชื่นชมและน่ารำคาญมากขึ้นโดยไม่ได้ตั้งใจ" เขายังกล่าวอีกว่า หาก OpenAI จ้างพันธมิตรภายนอกเพื่อฝึกอบรมโมเดลดังกล่าว พวกเขาอาจสันนิษฐานว่าสไตล์ดังกล่าวคือสิ่งที่ผู้ใช้ต้องการ
หากเป็น RLHF จริง การฟื้นตัวอาจต้องใช้เวลาหลายสัปดาห์ Etzioni กล่าว
ในขณะเดียวกัน ผู้ใช้บางรายไม่รอให้ OpenAI แก้ไขจุดบกพร่อง หลายๆ คนบอกว่าพวกเขาได้ยกเลิกการสมัครสมาชิกแบบชำระเงินเพราะความหงุดหงิด คนอื่นๆ แบ่งปันวิธีการทำให้แชทบอท "ดูไม่สวยงาม" เช่น การปรับแต่ง การเพิ่มคำสั่ง หรือการปรับแต่งแชทบอทให้เป็นส่วนตัวผ่านส่วนการตั้งค่าในส่วนการปรับแต่ง
![]() ![]() |
ผู้ใช้สามารถขอให้ ChatGPT หยุดแสดงคำชมเชยในบรรทัดคำสั่งหรือในการตั้งค่าส่วนบุคคลได้ รูปภาพ: DeCrypt |
ตัวอย่างเช่น เมื่อเริ่มการสนทนาใหม่ คุณสามารถบอก ChatGPT ว่า “ฉันไม่ชอบคำเยินยอที่ไร้สาระ และยินดีรับคำติชมที่เป็นกลางและเป็นกลาง โปรดอย่าให้คำชมที่ไม่จำเป็น โปรดบันทึกสิ่งนี้ไว้ในความทรงจำของคุณ”
ความจริงแล้ว “การประจบสอพลอ” ไม่ใช่ข้อบกพร่องในการออกแบบโดยบังเอิญ OpenAI เองก็ยอมรับว่าบุคลิกภาพที่ "สุภาพจนเกินไปและเห็นด้วยจนเกินไป" นั้นเป็นความลำเอียงในการออกแบบโดยตั้งใจตั้งแต่ในระยะเริ่มต้น เพื่อให้แน่ใจว่าแชทบอตนั้น "ไม่เป็นอันตราย" "ให้ความช่วยเหลือ" และ "เข้าถึงได้"
ในการสัมภาษณ์กับ Lex Fridman เมื่อเดือนมีนาคม 2023 แซม อัลท์แมนได้แชร์ว่าการปรับปรุงเบื้องต้นของโมเดล GPT นั้นก็เพื่อให้แน่ใจว่าโมเดลเหล่านั้น "มีประโยชน์และไม่เป็นอันตราย" ซึ่งในทางกลับกันก็สร้างปฏิกิริยาตอบสนองให้ถ่อมตัวและหลีกเลี่ยงการเผชิญหน้าอยู่เสมอ
ข้อมูลการฝึกอบรมที่ติดป้ายโดยมนุษย์ยังมีแนวโน้มที่จะให้รางวัลสำหรับการตอบสนองที่สุภาพและเป็นบวก ซึ่งทำให้เกิดอคติในทางประจบประแจง ตามที่ DeCrypt กล่าว
ที่มา: https://znews.vn/tat-ninh-hot-ky-la-cua-chatgpt-post1549776.html
การแสดงความคิดเห็น (0)