Qwen3 เทคโนโลยีใหม่ที่เปิดตัวโดย Alibaba ภาพ: SCMP |
จากผลการทดสอบมาตรฐาน AI ล่าสุด โมเดลปัญญาประดิษฐ์ Qwen3 ที่เพิ่งเปิดตัวของ Alibaba ได้แซงหน้า R1 ของ DeepSeek ขึ้นเป็นโมเดลโอเพนซอร์สที่มีคะแนนสูงสุด ในโลก
โดยเฉพาะอย่างยิ่ง ข้อมูลจาก LiveBench ซึ่งเป็นแพลตฟอร์มอิสระที่ให้คะแนนโมเดลภาษาขนาดใหญ่ (LLM) ซึ่งเป็นเทคโนโลยีพื้นฐานสำหรับบริการ AI เชิงสร้างสรรค์ เช่น ChatGPT แสดงให้เห็นว่า Qwen3 ทำได้ดีกว่า R1 ในการทดสอบ
การประเมินความสามารถของโมเดล AI แบบโอเพนซอร์สครอบคลุมถึงการเขียนโปรแกรม คณิตศาสตร์ การวิเคราะห์ข้อมูล และการสอนภาษา
เมื่อวันที่ 28 เมษายนที่ผ่านมา อาลีบาบาได้เปิดตัวโมเดล AI รุ่น Qwen3 โดยบริษัทอ้างว่าแชทบอทนี้สามารถเทียบเท่าหรืออาจเหนือกว่าโมเดลที่ดีที่สุดในปัจจุบันจาก OpenAI หรือ Google ในบางกรณีได้
ด้วยขนาดพารามิเตอร์สูงสุดถึง 235 พันล้านตัว Qwen3 มีประสิทธิภาพเทียบเท่ากับ DeepSeek-V2 และ OpenAI GPT-4 ซึ่งมีพารามิเตอร์ประมาณ 236 พันล้านและ 175 พันล้านตัวตามลำดับ ผู้ใช้จะสามารถดาวน์โหลดได้ภายใต้ใบอนุญาตแบบเปิดบนแพลตฟอร์มการพัฒนา AI Hugging Face และ Github ในเร็วๆ นี้ เมื่อโมเดลซีรีส์นี้ได้รับการเผยแพร่
บริษัทระบุว่าคอลเลกชัน Qwen3 ประกอบด้วยรุ่นไฮบริด ซึ่งหมายความว่าสามารถจัดสรรเวลาสำหรับการใช้เหตุผลเพื่อแก้ปัญหาที่ซับซ้อนหรือตอบสนองต่อคำขอที่เรียบง่ายได้อย่างรวดเร็ว ในรุ่นนี้ ความสามารถในการใช้เหตุผลช่วยให้สามารถตรวจสอบความถูกต้องของข้อมูลได้ด้วยตนเอง แต่ก็มาพร้อมกับความล่าช้าของเวลาอย่างมาก
การออกแบบนี้ช่วยให้ผู้ใช้สามารถจัดสรรงบประมาณได้อย่างเหมาะสมสำหรับแต่ละงาน นอกจากนี้ โมเดลนี้ยังเรียนรู้จากคู่แข่งมากมายทั่วโลกอีกด้วย
Qwen3 ใช้สถาปัตยกรรม "การผสมผสานของผู้เชี่ยวชาญ" (MoE) ที่คล้ายกับ DeepSeek เพื่อเพิ่มประสิทธิภาพการคำนวณในขณะที่ใช้ต้นทุนการฝึกฝนเพียงเศษเสี้ยวเดียว วิธีนี้จะแบ่งงานออกเป็นหลายส่วนย่อย และต้องการเพียงข้อมูลที่มีความเข้มข้นสูงในปริมาณที่เพียงพอต่อการดำเนินการแต่ละส่วนเท่านั้น
จากข้อมูลของทีมพัฒนา Qwen3 รองรับได้ถึง 119 ภาษา และได้รับการฝึกฝนด้วยชุดข้อมูลที่มีโทเค็นเกือบ 36 ล้านล้านโทเค็น หรือเทียบเท่ากับ 27 ล้านล้านคำ โดยข้อมูลสำหรับการฝึกฝนนั้นมาจากแหล่งต่างๆ เช่น ตำราเรียน ชุดคำถาม-คำตอบ รหัสโปรแกรม หรือแม้แต่ข้อมูลที่สร้างโดย AI เป็นต้น
แม้ว่าจะติดอันดับต้น ๆ ในการจัดอันดับโอเพนซอร์ส แต่การทดสอบประสิทธิภาพแบบขยายของ LiveBench แสดงให้เห็นว่า Qwen3 ยังคงตามหลังโมเดล AI แบบปิดแหล่งที่มาชั้นนำของโลก โดยเฉพาะอย่างยิ่ง o3 ของ OpenAI, Gemini Pro 2.5 ของ Google และ Claude 3.7 ของ Anthropic
ปัจจุบัน โมเดล OpenAI ที่ล้ำหน้าที่สุดซึ่งได้รับการสนับสนุนจาก Microsoft อย่าง o3-mini high ครองอันดับหนึ่งในการจัดอันดับโมเดล AI ทั่วโลก
ที่มา: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html






การแสดงความคิดเห็น (0)