GPT-4 เป็นแบบ "มัลติโมดอล" หมายความว่าสามารถตอบคำถามที่ประกอบด้วยทั้งรูปภาพและข้อความได้

ภาพ: GI
GPT-3.5 ให้ผลลัพธ์จากคำถามที่เขียนเท่านั้น ในขณะที่เวอร์ชันล่าสุดของแบบจำลองภาษาขนาดใหญ่นี้สามารถใช้รูปภาพเป็นข้อมูลป้อนเข้าเพื่อระบุและวิเคราะห์วัตถุในภาพได้
GPT-3.5 จำกัดจำนวนคำในการตอบไว้ที่ประมาณ 3,000 คำ ในขณะที่ GPT-4 อนุญาตให้ตอบได้มากกว่า 25,000 คำ
GPT-4 ตอบสนองต่อคำขอเกี่ยวกับเนื้อหาที่ไม่เหมาะสมได้เร็วกว่ารุ่นก่อนถึง 82% และทำคะแนนได้สูงกว่าในการทดสอบเชิงปฏิบัติหลายรายการถึง 40%
นอกจากนี้ยังช่วยให้นักพัฒนาสามารถตัดสินใจเลือกรูปแบบโทนเสียงและระดับรายละเอียดสำหรับ AI ของตนได้อีกด้วย
OpenAI ระบุว่า ผู้ใช้ ChatGPT จะสามารถเปลี่ยนโทนเสียงและรูปแบบการตอบกลับของแชทบอทได้ในเร็วๆ นี้
เวอร์ชันล่าสุดทำผลงานได้ดีกว่าเวอร์ชันก่อนหน้าทั้งในการสอบเนติบัณฑิตของสหรัฐอเมริกาและการสอบ Graduate Resume Exam (GRE)
จากข้อมูลของ OpenAI ระบุว่า GPT-4 มีข้อจำกัดคล้ายกับรุ่นก่อนหน้า และ "ด้อยกว่ามนุษย์ในสถานการณ์ จริง หลายๆ อย่าง"
การตอบสนองที่ไม่ถูกต้อง หรือที่เรียกว่า "ภาพหลอน" เป็นความท้าทายสำหรับโปรแกรม AI หลายโปรแกรม รวมถึง GPT-4 ด้วย
GPT-4 ขาดข้อมูลเกี่ยวกับเหตุการณ์ที่เกิดขึ้นหลังเดือนกันยายน 2021
GPT-4 กำลังถูกนำไปผสานรวมเข้ากับแชทบอท Bing AI ของ Microsoft และแพลตฟอร์มการเรียนรู้ภาษาชื่อดังอย่าง Duolingo
ไมอัน (ตามรายงานของรอยเตอร์)
[โฆษณา_2]
แหล่งที่มา






การแสดงความคิดเห็น (0)