Qwen3 เทคโนโลยีใหม่ที่เปิดตัวโดยอาลีบาบา ภาพ: SCMP |
จากการทดสอบประสิทธิภาพ AI ล่าสุด โมเดลปัญญาประดิษฐ์ Qwen3 ใหม่ของ Alibaba ได้แซงหน้า R1 ของ DeepSeek ขึ้นเป็นโมเดลโอเพ่นซอร์สที่ได้รับอันดับสูงสุดในโลก
โดยเฉพาะข้อมูลจาก LiveBench ซึ่งเป็นแพลตฟอร์มอิสระที่ประเมินประสิทธิภาพของโมเดลภาษาขนาดใหญ่ (LLM) ซึ่งเป็นเทคโนโลยีพื้นฐานสำหรับบริการ AI เชิงสร้างสรรค์ เช่น ChatGPT แสดงให้เห็นว่า Qwen3 มีประสิทธิภาพเหนือกว่า R1 ในการทดสอบ
บทวิจารณ์นี้จะประเมินความสามารถของโมเดล AI โอเพนซอร์ส รวมถึงการเขียนโปรแกรม คณิตศาสตร์ การวิเคราะห์ข้อมูล และการสอนภาษา
ซีรีย์โมเดล AI ที่เรียกว่า Qwen3 ได้รับการเปิดตัวโดย Alibaba เมื่อวันที่ 28 เมษายน บริษัทอ้างว่าแชทบอทนี้สามารถเทียบเคียงได้หรือแม้กระทั่งแซงหน้าโมเดลที่ดีที่สุดที่มีอยู่ในปัจจุบันจาก OpenAI หรือ Google ในบางกรณี
ด้วยขนาดที่สูงถึง 235 พันล้านพารามิเตอร์ Qwen3 จึงเทียบชั้นกับ DeepSeek-V2 และ OpenAI GPT-4 ซึ่งมีพารามิเตอร์ประมาณ 236 พันล้านและ 175 พันล้านพารามิเตอร์ตามลำดับ ผู้ใช้จะสามารถดาวน์โหลดภายใต้ใบอนุญาตแบบเปิดบนแพลตฟอร์มพัฒนา AI Hugging Face และ Github ได้เร็วๆ นี้ เมื่อซีรีส์โมเดลนี้เปิดตัว
บริษัทกล่าวว่าคอลเลกชั่น Qwen3 ประกอบด้วยโมเดลไฮบริด ซึ่งหมายความว่าโมเดลเหล่านี้สามารถใช้เหตุผลอย่างยืดหยุ่นเพื่อแก้ปัญหาที่ซับซ้อนหรือตอบสนองต่อคำขอที่เรียบง่ายได้อย่างรวดเร็ว ในกรณีนี้ ความสามารถในการใช้เหตุผลช่วยให้โมเดลสามารถตรวจสอบความถูกต้องของข้อมูลได้ด้วยตัวเอง แต่ต้องแลกมาด้วยความล่าช้าที่สูง
การออกแบบนี้ช่วยให้ผู้ใช้สามารถจัดสรรงบประมาณที่เหมาะสมสำหรับแต่ละงานได้อย่างง่ายดาย นอกจากนี้ โมเดลนี้ยังเรียนรู้จากคู่แข่งมากมายทั่วโลกอีกด้วย
การใช้สถาปัตยกรรม "การผสมผสานผู้เชี่ยวชาญ" (MoE) คล้ายกับ DeepSeek ทำให้ Qwen3 สามารถเพิ่มประสิทธิภาพการคำนวณให้สูงสุดด้วยต้นทุนการฝึกอบรมเพียงเศษเสี้ยว นี่คือวิธีการแบ่งงานออกเป็นส่วนต่างๆ และแนะนำเฉพาะข้อมูลเชิงลึกที่จำเป็นในการดำเนินการเท่านั้น
ตามข้อมูลของทีมพัฒนา Qwen3 รองรับภาษาต่างๆ มากถึง 119 ภาษา และได้รับการฝึกบนชุดข้อมูลที่มีโทเค็นเกือบ 36,000 พันล้านโทเค็น ซึ่งเทียบเท่ากับคำศัพท์ 27,000 พันล้านคำ ข้อมูลการฝึกนำมาจากหลายแหล่ง เช่น หนังสือเรียน ชุดคำถาม-คำตอบ โค้ดโปรแกรม หรือ AI ที่สร้างขึ้นเอง...
แม้ว่า Qwen3 จะอยู่ในอันดับต้นๆ ของการจัดอันดับโอเพ่นซอร์ส แต่การทดสอบอย่างละเอียดโดย LiveBench แสดงให้เห็นว่า Qwen3 ยังคงตามหลังโมเดล AI ซอร์สปิดชั้นนำของโลก โดยเฉพาะอย่างยิ่ง o3 ของ OpenAI, Gemini Pro 2.5 ของ Google และ Claude 3.7 ของ Anthropic
ปัจจุบันโมเดลระดับสูงสุดของ OpenAI ที่ได้รับการสนับสนุนจาก Microsoft ซึ่งก็คือ o3-mini high นั้นอยู่ในอันดับต้นๆ ของการจัดอันดับโมเดล AI โดยรวมของโลก
ที่มา: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html
การแสดงความคิดเห็น (0)