Vietnam.vn - Nền tảng quảng bá Việt Nam

รูปแบบการอนุมานใหม่ของ ChatGPT

ผู้ใช้จำนวนมากมองว่า o3 pro เหนือกว่าแชทบอทอื่นๆ ในบางด้าน อย่างไรก็ตาม รุ่นนี้ยังมีข้อเสียสำคัญและมีการใช้งานของตัวเอง

ZNewsZNews16/06/2025

o3 pro โดดเด่นในเรื่องความสามารถในการจัดการคำขอที่ซับซ้อน รูปภาพ: OpenAI

OpenAI ได้เปิดตัว o3 pro ในแพ็คเกจ Pro ในราคา 200 เหรียญสหรัฐฯ ต่อเดือนและแบบ Team ผ่าน API โดย o3 pro เป็นเวอร์ชันอัปเกรดของ o3 ที่เปิดตัวเมื่อไม่กี่เดือนที่ผ่านมา และถือเป็นเวอร์ชันที่ทรงพลังที่สุดของบริษัท

เวอร์ชันทั้งหมดที่มีแท็ก "pro" จะเชื่อมโยงกับความสามารถในการตอบคำถามที่ยากและยาวขึ้น ซึ่งแตกต่างจากเวอร์ชัน AI ทั่วไป โมเดลอนุมานจะแก้ปัญหาทีละขั้นตอน ทำให้ทำงานได้อย่างน่าเชื่อถือและสม่ำเสมอมากขึ้นในด้านต่างๆ เช่น ฟิสิกส์ คณิตศาสตร์ และการเขียนโปรแกรม

บริษัทกล่าวว่า “เราขอแนะนำ o3-pro สำหรับคำถามยากๆ ที่ความน่าเชื่อถือสำคัญกว่าความเร็ว และการรอสักสองสามนาทีก็คุ้มค่า” จากการทดสอบร่วมกัน พบว่า o3-pro มีประสิทธิภาพเหนือกว่าเวอร์ชัน o3 และ o1-pro

เบน ไฮแล็ค อดีตพนักงานของ Apple และผู้ร่วมก่อตั้งบริษัทสตาร์ทอัพด้าน AI ชื่อ Raindrop กล่าวว่าโมเดลใหม่นี้มีความชาญฉลาดมากขึ้น เขารวบรวมประวัติการประชุมก่อนหน้านี้ทั้งหมดที่บริษัทของเขา จากนั้นจึงขอให้ o3-pro สร้างแผนขึ้นมา

ผลลัพธ์ที่ได้นั้นน่าประทับใจ เจาะจงและวิเคราะห์ได้อย่างดีตามที่เขาคาดหวังจากโมเดลภาษาขนาดใหญ่ (LLM) แผนดังกล่าวประกอบด้วยตัวชี้วัดเป้าหมาย ไทม์ไลน์ ลำดับความสำคัญ และคำแนะนำที่เข้มงวดเกี่ยวกับสิ่งที่ต้องกำจัดออกไปโดยสิ้นเชิง “แผนดังกล่าวเจาะจงและมีเหตุผลมากจนผมต้องคิดทบทวนอนาคตของบริษัทใหม่” เขาเขียน

แบบจำลองการใช้เหตุผลแบบใหม่ ภาพที่ 1

ผลลัพธ์ที่ได้จาก o3 pro (ซ้าย) มีความเฉพาะเจาะจงและชัดเจนมากขึ้น รูปภาพ: Ben Hylak/X

O3-pro มีราคา 20 เหรียญต่อโทเค็นอินพุต 1 ล้านโทเค็น และ 80 เหรียญต่อโทเค็นเอาท์พุต 1 ล้านโทเค็นเมื่อใช้ผ่าน API นั่นคือความสามารถของ AI ในการจดจำและประมวลผลข้อมูล โทเค็นอินพุต 1 ล้านโทเค็นเทียบเท่ากับคำศัพท์ประมาณ 750,000 คำ ซึ่งยาวกว่าหนังสือ War and Peace , The Verge ที่เปรียบเทียบไว้

OpenAI เขียนว่าผู้เชี่ยวชาญให้คะแนน o3 pro สูงกว่า o3 ในทุกหมวดหมู่ที่ทดสอบอย่างสม่ำเสมอ นอกจากนี้ ผู้ประเมินยังให้คะแนน o3 pro สูงกว่าในด้านความสม่ำเสมอในเกณฑ์ต่างๆ รวมถึงความชัดเจน ความง่ายในการปฏิบัติตามคำแนะนำ และความแม่นยำ โดยเฉพาะอย่างยิ่งในด้านสำคัญๆ เช่น วิทยาศาสตร์ การศึกษา การเขียนโปรแกรม ธุรกิจ และการสนับสนุนการเขียน

ในการทดสอบ AIME 2024 ซึ่งเป็นการทดสอบที่ประเมินความสามารถทางคณิตศาสตร์ของโมเดล o3 pro ทำคะแนนได้สูงกว่า Gemini 2.5 Pro ซึ่งเป็น AI เรือธงของ Google นอกจากนี้ โมเดลดังกล่าวยังแซงหน้า Claude 4 Opus ของ Anthropic ใน GPQA Diamond ซึ่งเป็นการทดสอบความรู้ ทางวิทยาศาสตร์ ระดับปริญญาเอกอีกด้วย

o3 pro ยังมาพร้อมกับเครื่องมือในตัวที่ช่วยให้ค้นหาเว็บ วิเคราะห์ไฟล์ ใช้ Python สำหรับการคำนวณและการเขียนโปรแกรม และปรับแต่งการตอบสนองโดยใช้หน่วยความจำ Ben Hylak แสดงความคิดเห็นเกี่ยวกับประเด็นนี้ว่าเครื่องมือนี้แสดงให้เห็นอย่างชัดเจนถึงความสามารถในการจดจำสภาพแวดล้อม เมื่อต้องถามเกี่ยวกับโลกภายนอก (แทนที่จะแสร้งทำเป็นรู้) และเลือกเครื่องมือที่เหมาะสมสำหรับแต่ละงาน

อย่างไรก็ตาม ข้อเสียที่ใหญ่ที่สุดของโมเดลนี้คือเวลาตอบสนองซึ่งช้ากว่า o1 pro เสียอีก Bijan Bowen ผู้ใช้ YouTube ก็เห็นด้วย “แม้ว่าคำตอบของโมเดลจะค่อนข้างชัดเจน แต่ด้วยคำอธิบายเพียงไม่กี่ประโยค เวลาตอบสนองก็ค่อนข้างนาน” เขากล่าว โดยเฉพาะอย่างยิ่งในกรณีที่ไม่มีข้อมูลภายนอกเพียงพอ โมเดลมักจะคิดแบบสุ่ม Ben Hylak กล่าวเสริม

O3-pro ยังมีข้อจำกัดอื่นๆ อีก เช่น ไม่สามารถสร้างรูปภาพได้ และยังรองรับฟีเจอร์ Canvas อีกด้วย ฟีเจอร์แชทชั่วคราวของ ChatGPT ที่ใช้โมเดลนี้ถูกปิดใช้งานอยู่ขณะนี้ ขณะที่ OpenAI กำลังแก้ไข "ปัญหาทางเทคนิค"

อย่างไรก็ตาม คุณไฮแล็คกล่าวว่านี่ไม่ใช่โมเดลสำหรับให้ผู้ใช้แชทเหมือนกับ Claude 3.5 Sonnet หรือ ChatGPT 4o คำแนะนำจาก Nate B. Jones หัวหน้าฝ่ายผลิตภัณฑ์ของ Rockerbox กล่าวว่า o3 pro ควรใช้สำหรับงานยากๆ ที่ต้องใช้เวลาคิด 15-20 นาที


ที่มา: https://znews.vn/mo-hinh-suy-luan-moi-cua-chatgpt-post1560084.html


การแสดงความคิดเห็น (0)

No data
No data

หมวดหมู่เดียวกัน

พลุระเบิด ท่องเที่ยวคึกคัก ดานังคึกคักในฤดูร้อนปี 2568
สัมผัสประสบการณ์ตกปลาหมึกตอนกลางคืนและชมปลาดาวที่เกาะไข่มุกฟูก๊วก
ค้นพบขั้นตอนการทำชาดอกบัวที่แพงที่สุดในฮานอย
ชมเจดีย์อันเป็นเอกลักษณ์ที่สร้างจากเครื่องปั้นดินเผาที่มีน้ำหนักกว่า 30 ตันในนครโฮจิมินห์

ผู้เขียนเดียวกัน

มรดก

รูป

ธุรกิจ

No videos available

ข่าว

ระบบการเมือง

ท้องถิ่น

ผลิตภัณฑ์