o3 pro โดดเด่นในเรื่องความสามารถในการจัดการคำขอที่ซับซ้อน รูปภาพ: OpenAI |
OpenAI ได้เปิดตัว o3 pro ในแพ็คเกจ Pro ในราคา 200 เหรียญสหรัฐฯ ต่อเดือนและแบบ Team ผ่าน API โดย o3 pro เป็นเวอร์ชันอัปเกรดของ o3 ที่เปิดตัวเมื่อไม่กี่เดือนที่ผ่านมา และถือเป็นเวอร์ชันที่ทรงพลังที่สุดของบริษัท
เวอร์ชันทั้งหมดที่มีแท็ก "pro" จะเชื่อมโยงกับความสามารถในการตอบคำถามที่ยากและยาวขึ้น ซึ่งแตกต่างจากเวอร์ชัน AI ทั่วไป โมเดลอนุมานจะแก้ปัญหาทีละขั้นตอน ทำให้ทำงานได้อย่างน่าเชื่อถือและสม่ำเสมอมากขึ้นในด้านต่างๆ เช่น ฟิสิกส์ คณิตศาสตร์ และการเขียนโปรแกรม
บริษัทกล่าวว่า “เราขอแนะนำ o3-pro สำหรับคำถามยากๆ ที่ความน่าเชื่อถือสำคัญกว่าความเร็ว และการรอสักสองสามนาทีก็คุ้มค่า” จากการทดสอบร่วมกัน พบว่า o3-pro มีประสิทธิภาพเหนือกว่าเวอร์ชัน o3 และ o1-pro
เบน ไฮแล็ค อดีตพนักงานของ Apple และผู้ร่วมก่อตั้งบริษัทสตาร์ทอัพด้าน AI ชื่อ Raindrop กล่าวว่าโมเดลใหม่นี้มีความชาญฉลาดมากขึ้น เขารวบรวมประวัติการประชุมก่อนหน้านี้ทั้งหมดที่บริษัทของเขา จากนั้นจึงขอให้ o3-pro สร้างแผนขึ้นมา
ผลลัพธ์ที่ได้นั้นน่าประทับใจ เจาะจงและวิเคราะห์ได้อย่างดีตามที่เขาคาดหวังจากโมเดลภาษาขนาดใหญ่ (LLM) แผนดังกล่าวประกอบด้วยตัวชี้วัดเป้าหมาย ไทม์ไลน์ ลำดับความสำคัญ และคำแนะนำที่เข้มงวดเกี่ยวกับสิ่งที่ต้องกำจัดออกไปโดยสิ้นเชิง “แผนดังกล่าวเจาะจงและมีเหตุผลมากจนผมต้องคิดทบทวนอนาคตของบริษัทใหม่” เขาเขียน
ผลลัพธ์ที่ได้จาก o3 pro (ซ้าย) มีความเฉพาะเจาะจงและชัดเจนมากขึ้น รูปภาพ: Ben Hylak/X |
O3-pro มีราคา 20 เหรียญต่อโทเค็นอินพุต 1 ล้านโทเค็น และ 80 เหรียญต่อโทเค็นเอาท์พุต 1 ล้านโทเค็นเมื่อใช้ผ่าน API นั่นคือความสามารถของ AI ในการจดจำและประมวลผลข้อมูล โทเค็นอินพุต 1 ล้านโทเค็นเทียบเท่ากับคำศัพท์ประมาณ 750,000 คำ ซึ่งยาวกว่าหนังสือ War and Peace , The Verge ที่เปรียบเทียบไว้
OpenAI เขียนว่าผู้เชี่ยวชาญให้คะแนน o3 pro สูงกว่า o3 ในทุกหมวดหมู่ที่ทดสอบอย่างสม่ำเสมอ นอกจากนี้ ผู้ประเมินยังให้คะแนน o3 pro สูงกว่าในด้านความสม่ำเสมอในเกณฑ์ต่างๆ รวมถึงความชัดเจน ความง่ายในการปฏิบัติตามคำแนะนำ และความแม่นยำ โดยเฉพาะอย่างยิ่งในด้านสำคัญๆ เช่น วิทยาศาสตร์ การศึกษา การเขียนโปรแกรม ธุรกิจ และการสนับสนุนการเขียน
ในการทดสอบ AIME 2024 ซึ่งเป็นการทดสอบที่ประเมินความสามารถทางคณิตศาสตร์ของโมเดล o3 pro ทำคะแนนได้สูงกว่า Gemini 2.5 Pro ซึ่งเป็น AI เรือธงของ Google นอกจากนี้ โมเดลดังกล่าวยังแซงหน้า Claude 4 Opus ของ Anthropic ใน GPQA Diamond ซึ่งเป็นการทดสอบความรู้ ทางวิทยาศาสตร์ ระดับปริญญาเอกอีกด้วย
o3 pro ยังมาพร้อมกับเครื่องมือในตัวที่ช่วยให้ค้นหาเว็บ วิเคราะห์ไฟล์ ใช้ Python สำหรับการคำนวณและการเขียนโปรแกรม และปรับแต่งการตอบสนองโดยใช้หน่วยความจำ Ben Hylak แสดงความคิดเห็นเกี่ยวกับประเด็นนี้ว่าเครื่องมือนี้แสดงให้เห็นอย่างชัดเจนถึงความสามารถในการจดจำสภาพแวดล้อม เมื่อต้องถามเกี่ยวกับโลกภายนอก (แทนที่จะแสร้งทำเป็นรู้) และเลือกเครื่องมือที่เหมาะสมสำหรับแต่ละงาน
อย่างไรก็ตาม ข้อเสียที่ใหญ่ที่สุดของโมเดลนี้คือเวลาตอบสนองซึ่งช้ากว่า o1 pro เสียอีก Bijan Bowen ผู้ใช้ YouTube ก็เห็นด้วย “แม้ว่าคำตอบของโมเดลจะค่อนข้างชัดเจน แต่ด้วยคำอธิบายเพียงไม่กี่ประโยค เวลาตอบสนองก็ค่อนข้างนาน” เขากล่าว โดยเฉพาะอย่างยิ่งในกรณีที่ไม่มีข้อมูลภายนอกเพียงพอ โมเดลมักจะคิดแบบสุ่ม Ben Hylak กล่าวเสริม
O3-pro ยังมีข้อจำกัดอื่นๆ อีก เช่น ไม่สามารถสร้างรูปภาพได้ และยังรองรับฟีเจอร์ Canvas อีกด้วย ฟีเจอร์แชทชั่วคราวของ ChatGPT ที่ใช้โมเดลนี้ถูกปิดใช้งานอยู่ขณะนี้ ขณะที่ OpenAI กำลังแก้ไข "ปัญหาทางเทคนิค"
อย่างไรก็ตาม คุณไฮแล็คกล่าวว่านี่ไม่ใช่โมเดลสำหรับให้ผู้ใช้แชทเหมือนกับ Claude 3.5 Sonnet หรือ ChatGPT 4o คำแนะนำจาก Nate B. Jones หัวหน้าฝ่ายผลิตภัณฑ์ของ Rockerbox กล่าวว่า o3 pro ควรใช้สำหรับงานยากๆ ที่ต้องใช้เวลาคิด 15-20 นาที
ที่มา: https://znews.vn/mo-hinh-suy-luan-moi-cua-chatgpt-post1560084.html
การแสดงความคิดเห็น (0)