Qwen3 เทคโนโลยีใหม่เปิดตัวจากอาลีบาบา ภาพ : Reuters . |
เมื่อวันที่ 28 เมษายน บริษัทยักษ์ใหญ่ด้านเทคโนโลยีของจีนอย่าง Alibaba ได้เปิดตัวโมเดล AI ชุดหนึ่งที่เรียกว่า Qwen3 บริษัทอ้างว่าแชทบอทนี้สามารถเทียบเคียงหรือแม้กระทั่งทำงานได้ดีกว่าโมเดลปัจจุบันที่ดีที่สุดจาก OpenAI หรือ Google ในบางกรณี
ด้วยขนาดพารามิเตอร์สูงสุดถึง 235 พันล้านพารามิเตอร์ Qwen3 จึงมีประสิทธิภาพทัดเทียมกับ DeepSeek-V2 และ OpenAI GPT-4 ซึ่งมีพารามิเตอร์ประมาณ 236 พันล้านและ 175 พันล้านพารามิเตอร์ ตามลำดับ เร็วๆ นี้ ผู้ใช้จะสามารถดาวน์โหลดภายใต้ใบอนุญาตแบบเปิดบนแพลตฟอร์มการพัฒนา Hugging Face AI และ Github ได้ เมื่อซีรีส์โมเดลนี้เปิดตัว
บริษัทกล่าวว่าคอลเลกชั่น Qwen3 ประกอบด้วยโมเดลไฮบริด ซึ่งหมายถึงว่าผู้ใช้สามารถจัดเวลาในการคิดเหตุผลเพื่อแก้ปัญหาที่ซับซ้อนหรือตอบสนองคำขอที่เรียบง่ายได้อย่างรวดเร็ว ความสามารถในการอนุมานนี้ช่วยให้โมเดลสามารถตรวจสอบความถูกต้องของข้อมูลได้ด้วยตนเอง แต่จะต้องมีความหน่วงเวลาสูง
การออกแบบนี้ช่วยให้ผู้ใช้สามารถจัดสรรงบประมาณที่เหมาะสมสำหรับงานเฉพาะแต่ละงานได้อย่างง่ายดาย นอกจากนี้โมเดลนี้ยังเรียนรู้จากคู่แข่งทั่วโลก มากมายอีกด้วย
ด้วยการใช้สถาปัตยกรรม "ส่วนผสมของผู้เชี่ยวชาญ" (MoE) เดียวกันกับ DeepSeek ทำให้ Qwen3 สามารถเพิ่มประสิทธิภาพการคำนวณให้เหมาะสมที่สุด แต่ใช้ต้นทุนการฝึกอบรมเพียงเล็กน้อยเท่านั้น นี่คือวิธีการแบ่งงานออกเป็นส่วนต่างๆ และแนะนำเฉพาะข้อมูลเชิงลึกที่เพียงพอในการดำเนินการเท่านั้น
ตามที่ทีมพัฒนาได้ระบุไว้ Qwen3 รองรับมากถึง 119 ภาษา และได้รับการฝึกอบรมบนชุดข้อมูลที่มีโทเค็นเกือบ 36 ล้านล้านโทเค็น ซึ่งเทียบเท่ากับคำศัพท์ 27 ล้านล้านคำ ข้อมูลการฝึกอบรมนำมาจากหลายแหล่ง เช่น หนังสือเรียน ชุดคำถาม-คำตอบ โค้ดโปรแกรม หรือสร้างโดย AI
การปรับปรุงเหล่านี้รวมทั้งการปรับปรุงอื่นๆ อีกมากมายทำให้ความสามารถของแชทบอทเพิ่มขึ้นอย่างมากเมื่อเทียบกับรุ่นก่อนอย่าง Qwen2 Techcrunch ระบุว่าแม้ Qwen 3 จะไม่มีประสิทธิภาพเหนือกว่ารุ่นท็อปล่าสุดอย่าง o3 หรือ o4-mini ของ OpenAI มากนักแต่ก็ยังแสดงให้เห็นถึงประสิทธิภาพที่น่าประทับใจ
![]() |
เปรียบเทียบคะแนนจากการทดสอบประเมิน ภาพโดย: Qwen/X. |
Qwen-3-235B-A22B ซึ่งเป็นโมเดลที่ใหญ่ที่สุดในคอลเลคชันนี้ เอาชนะ o3-mini ของ OpenAI และ Gemini 2.5 Pro ของ Google บน Codeforces ซึ่งเป็นแพลตฟอร์มการแข่งขันการเขียนโปรแกรมยอดนิยม นอกจากนี้ซอฟต์แวร์ยังมีประสิทธิภาพดีกว่า o3-mini ในการทดสอบความยากของ AIME และ BFCL ซึ่งเป็นการประเมินความสามารถในการใช้เหตุผลของแบบจำลอง
Qwen-3-235B-A22B ยังไม่ได้เปิดตัวอย่างเป็นทางการต่อสาธารณชน ในขณะเดียวกันผู้ใช้สามารถดาวน์โหลด Qwen3-32B ได้ โมเดลนี้มีประสิทธิภาพเหนือกว่า o1 ของ OpenAI ในการประเมินประสิทธิภาพหลายๆ อย่าง รวมถึงการทดสอบการเขียนโปรแกรม LiveCodeBench
อาลีบาบากล่าวว่า Qwen3 โดดเด่นในด้านการเรียกเครื่องมือ การปฏิบัติตามคำสั่ง และการจำลองรูปแบบข้อมูลอย่างแม่นยำ นี่คือองค์ประกอบที่เครื่องมืออื่นๆ หลายตัวไม่มี งานวิจัยจากมหาวิทยาลัยคาร์เนกีเมลลอนพบว่า AI จำนวนมากสร้างข้อมูลปลอมและเปลี่ยนรูปแบบ แม้ว่าจะได้รับคำขอโดยเฉพาะก็ตาม
นอกจากการดาวน์โหลดบนแพลตฟอร์มดังกล่าวข้างต้นแล้ว ผู้ใช้ยังสามารถค้นหา Qwen3 ได้ผ่านผู้ให้บริการคลาวด์ เช่น Fireworks AI และ Hyperbolic ซึ่งจะช่วยให้ธุรกิจทั้งขนาดใหญ่และขนาดเล็กรวมถึงนักพัฒนาแต่ละรายสามารถเข้าถึงและทดลองสิ่งต่างๆ ได้อย่างเหนือขีดจำกัด
การเกิดขึ้นของ AI ของจีนบางตัว เช่น Qwen ส่งผลให้ห้องปฏิบัติการวิจัยของสหรัฐฯ ต้องเผชิญกับแรงกดดันมากขึ้น จนต้องพัฒนาเทคโนโลยีที่มีประสิทธิภาพมากยิ่งขึ้น ส่งผลให้ผู้กำหนดนโยบายของประเทศต้องตราข้อจำกัดเพื่อจำกัดการเข้าถึงชิปของจีน
Tuhin Srivastava ซีอีโอของ Baseten บริษัทผู้ให้บริการโฮสติ้ง AI บนคลาวด์ กล่าวว่า Qwen3 เป็นอีกหนึ่งตัวอย่างของโมเดลโอเพ่นซอร์สที่ตามทันระบบปิดอย่าง OpenAI
Qwen3 ยังคงถูกใช้กันอย่างแพร่หลายในประเทศ แม้จะมีข้อจำกัดจาก รัฐบาล สหรัฐฯ “นี่แสดงให้เห็นว่านอกเหนือจากการพึ่งพาโมเดลที่มีอยู่เช่น Anthropic และ OpenAI แล้ว บริษัทเทคโนโลยีของจีนก็ยังสามารถพัฒนาซอฟต์แวร์ของตัวเองได้” เขากล่าว
ที่มา: https://znews.vn/them-loat-ai-manh-me-tu-trung-quoc-post1549756.html
การแสดงความคิดเห็น (0)