GPT-4.5 เป็นโมเดลที่ใหญ่ที่สุดที่ OpenAI เคยสร้างมา ที่มา: The Verge |
การศึกษาวิจัยใหม่จากภาค วิชาวิทยาการ รู้คิด มหาวิทยาลัยแคลิฟอร์เนีย ซานดิเอโก ถือเป็นก้าวสำคัญในสาขาปัญญาประดิษฐ์ โดยโมเดล GPT-4.5 ของ OpenAI ประสบความสำเร็จในด้านประสิทธิภาพที่เหนือกว่าในการทดสอบทัวริงโดยใช้แนวทางการโต้ตอบที่อิงตาม "บุคลิกภาพ"
ระบบนี้ถือเป็นระบบการสนทนาด้วย AI ที่มีความใกล้เคียงกับมนุษย์มากที่สุดเท่าที่มีมา และเปิดโอกาสให้มีการประยุกต์ใช้ในด้านปัญญาทางสังคมได้มากมาย
OpenAI เรียก GPT-4.5 ว่าเป็น "ก้าวสำคัญในการปรับขนาดการฝึกอบรมก่อนและหลังการฝึกอบรม" โดยเป็นโมเดลที่ใหญ่ที่สุดที่ OpenAI เคยสร้างมา โดยมีขนาดและพลังการประมวลผลที่เหนือกว่าเวอร์ชันก่อนหน้า
ตามโพสต์บล็อกอย่างเป็นทางการของ OpenAI เมื่อวันที่ 27 กุมภาพันธ์ GPT-4.5 เริ่มเปิดตัวให้กับผู้ใช้ ChatGPT Pro ในวันเดียวกับที่มีการประกาศเปิดตัว
AI สามารถหลอกมนุษย์ได้หรือไม่?
การทดลองนี้ได้เปรียบเทียบระบบ AI ตัวแทนสี่ระบบ ได้แก่ แชทบอท ELIZA ในยุค 1960, LLaMa-3.1-405B ของ Meta AI และ GPT-4o และ GPT-4.5 ของ OpenAI ทีมวิจัยได้ออกแบบการทดสอบอิสระสองชุด โดยมีผู้เข้าร่วมชุดละ 250 คน รวมเป็น 500 คนจากแพลตฟอร์มออนไลน์อย่าง Prolific ผู้เข้าร่วมแต่ละชุดมีอายุ เพศ และระดับการศึกษาที่แตกต่างกัน เพื่อให้ได้กลุ่มตัวอย่างที่หลากหลาย
![]() |
ตารางเปรียบเทียบระบบ AI ทั่วไปทั้งสี่ระบบ ที่มา: AIbase |
การทดสอบใช้รูปแบบดั้งเดิมของทัวริง โดยผู้เข้าร่วมแต่ละคนจะสนทนาผ่านอินเทอร์เฟซข้อความกับผู้เข้าร่วม 2 คน (มนุษย์ 1 คน และ AI 1 คน) เป็นเวลา 5 นาที จากนั้นจึงให้คะแนนว่าใครเป็นมนุษย์
ผลลัพธ์น่าประหลาดใจ: GPT-4.5 มีอัตรา "ผ่านการทดสอบทัวริง" ที่ 73% ซึ่งสูงกว่าค่าเฉลี่ยของมนุษย์ (60-70%) นี่เป็นครั้งแรกที่โมเดล AI "ผ่าน" การทดสอบทัวริงมาตรฐานได้จริง ในขณะเดียวกัน GPT-4o ได้คะแนนต่ำกว่าเล็กน้อย LLaMa-3.1-405B มีคะแนนใกล้เคียงหรือเทียบเท่ากับมนุษย์ในบางบริบท และ ELIZA ก็ยังทำได้ไม่ถึง
ความสามารถในการโต้ตอบเหมือนมนุษย์
สิ่งที่ทำให้ GPT-4.5 โดดเด่นไม่ใช่แค่ความคล่องแคล่วทางภาษาเท่านั้น แต่ยังรวมถึงความสามารถในการแสดงอารมณ์และปรับการตอบสนองให้เข้ากับรายละเอียดปลีกย่อยของการสื่อสารของคู่สนทนา ผู้เข้าร่วมหลายคนกล่าวว่า GPT-4.5 เป็นโปรแกรมที่ "เป็นมิตร" และ "จริงใจ"
โดยเฉพาะอย่างยิ่งเมื่อผู้ใช้ดูสับสนหรือเครียด GPT-4.5 สามารถให้คำตอบที่ตลกหรือให้กำลังใจ ทำให้หลายคนรู้สึกเหมือนกำลังสนทนากับคนจริง ๆ
![]() |
บทสนทนาระหว่างผู้เข้าร่วมการทดลองสองคน (คนหนึ่งเป็น AI อีกคนเป็นมนุษย์) ระหว่างการทดสอบ ภาพ: UC San Diego |
ในขณะเดียวกัน LLaMa-3.1-405B แม้จะมีประสิทธิภาพทางเทคนิคที่น่าประทับใจ แต่กลับมีการแสดงออกและการปรับตัวตามบริบทได้น้อยกว่า GPT-4.5 ส่วน GPT-4o แม้จะมีประสิทธิภาพ แต่ก็ด้อยกว่าในแง่ของการปรับแต่งเฉพาะบุคคลและการปรับตัวตามสถานการณ์
ความก้าวหน้าของ GPT-4.5 อาจเปิดกว้างการประยุกต์ใช้งานจริงได้หลากหลาย ตั้งแต่ติวเตอร์เสมือนจริง การสนับสนุนทางจิตวิทยา ไปจนถึงการบริการลูกค้า แต่เมื่อปัญญาประดิษฐ์ (AI) พัฒนาไปคล้ายกับมนุษย์มากขึ้น การแยกแยะระหว่างความจริงกับจินตนาการ และการควบคุมวิธีการใช้เทคโนโลยีจะกลายเป็นความท้าทายสำคัญทางสังคม
งานวิจัยนี้เกิดขึ้นท่ามกลางความก้าวหน้าอย่างรวดเร็วของ AI ความสำเร็จของ GPT-4.5 ไม่เพียงแต่เป็นชัยชนะทางเทคนิคของ OpenAI เท่านั้น แต่ยังก่อให้เกิดคำถามเชิงลึกเกี่ยวกับความสัมพันธ์ระหว่างมนุษย์และเครื่องจักรอีกด้วย นักทดสอบคนหนึ่งให้ความเห็นว่าเขารู้สึกเหมือนกำลังคุยกับเพื่อน จนกระทั่งเขาตระหนักว่าทั้งหมดเป็นเพียงโค้ดบรรทัดเดียว บทสนทนาระหว่างมนุษย์และ AI อาจเพิ่งเริ่มต้นขึ้นเท่านั้น
ที่มา: https://znews.vn/chatgpt-da-vuot-qua-bai-danh-gia-quan-trong-xac-dinh-may-nguoi-post1542945.html
การแสดงความคิดเห็น (0)