ซีรีส์ AI ที่ทรงพลังยิ่งขึ้นจากจีน

โมเดลนี้สามารถแข่งขันกับคู่แข่งที่แข็งแกร่งจากทั่วโลกได้ แสดงถึงศักยภาพด้านเทคโนโลยีที่เพิ่มมากขึ้นจากประเทศที่มีประชากรนับพันล้านคน

ZNews•29/04/2025

Qwen3 เทคโนโลยีใหม่ที่เปิดตัวโดยอาลีบาบา ภาพ: รอยเตอร์ส

เมื่อวันที่ 28 เมษายน อาลีบาบา บริษัทเทคโนโลยียักษ์ใหญ่ของจีนได้เปิดตัวโมเดล AI รุ่นใหม่ที่มีชื่อว่า Qwen3 บริษัทอ้างว่าแชทบอทนี้สามารถเทียบเคียงหรือแม้กระทั่งมีประสิทธิภาพเหนือกว่าโมเดลที่ดีที่สุดในปัจจุบันจาก OpenAI หรือ Google ในบางกรณี

ด้วยขนาดพารามิเตอร์สูงสุดถึง 235 พันล้านพารามิเตอร์ Qwen3 จึงเทียบเท่ากับ DeepSeek-V2 และ OpenAI GPT-4 ซึ่งมีพารามิเตอร์ประมาณ 236 พันล้าน และ 175 พันล้านพารามิเตอร์ตามลำดับ ผู้ใช้จะสามารถดาวน์โหลดภายใต้ใบอนุญาตแบบเปิดบนแพลตฟอร์มพัฒนา AI Hugging Face และ Github ได้ในเร็วๆ นี้ เมื่อชุดโมเดลนี้เผยแพร่

บริษัทกล่าวว่าคอลเลกชัน Qwen3 ประกอบด้วยโมเดลไฮบริด ซึ่งหมายความว่าโมเดลเหล่านี้สามารถใช้เหตุผลได้อย่างยืดหยุ่นเพื่อแก้ปัญหาที่ซับซ้อน หรือตอบสนองต่อคำของ่ายๆ ได้อย่างรวดเร็ว ในกรณีนี้ ความสามารถในการใช้เหตุผลช่วยให้โมเดลสามารถตรวจสอบความถูกต้องของข้อมูลได้ด้วยตนเอง แต่ต้องแลกมาด้วยความล่าช้าที่สูง

การออกแบบนี้ช่วยให้ผู้ใช้สามารถจัดสรรงบประมาณที่เหมาะสมสำหรับแต่ละงานได้อย่างง่ายดาย นอกจากนี้ โมเดลนี้ยังได้เรียนรู้จากคู่แข่งมากมายทั่วโลก อีกด้วย

การใช้สถาปัตยกรรมแบบ "ผสมผสานผู้เชี่ยวชาญ" (MoE) คล้ายกับ DeepSeek ทำให้ Qwen3 สามารถเพิ่มประสิทธิภาพการประมวลผลได้สูงสุดด้วยต้นทุนการฝึกอบรมเพียงเศษเสี้ยวเดียว นี่คือวิธีการแบ่งงานออกเป็นส่วนๆ และแนะนำเฉพาะข้อมูลเชิงลึกที่จำเป็นต่อการทำงานเท่านั้น

ทีมพัฒนาระบุว่า Qwen3 รองรับภาษาต่างๆ มากถึง 119 ภาษา และได้รับการฝึกฝนบนชุดข้อมูลที่มีโทเค็นเกือบ 36 ล้านล้านโทเค็น ซึ่งเทียบเท่ากับคำศัพท์ 27 ล้านล้านคำ ข้อมูลการฝึกฝนนำมาจากหลายแหล่ง เช่น ตำราเรียน ชุดคำถาม-คำตอบ โค้ดโปรแกรม หรือ AI ที่สร้างขึ้นเอง...

การปรับปรุงเหล่านี้ รวมถึงการปรับปรุงอื่นๆ อีกมากมาย ได้ช่วยพัฒนาความสามารถของแชทบอทอย่างมีนัยสำคัญเมื่อเทียบกับรุ่นก่อนหน้าอย่าง Qwen2 Techcrunch ระบุว่า แม้ว่า Qwen 3 จะยังไม่สามารถเอาชนะโมเดลยอดนิยมล่าสุดอย่าง o3 หรือ o4-mini ของ OpenAI ได้ทั้งหมด แต่มันก็ยังคงแสดงให้เห็นถึงประสิทธิภาพที่น่าประทับใจ

การเปรียบเทียบคะแนนจากการทดสอบประเมิน ภาพ: Qwen/X

Qwen-3-235B-A22B ซึ่งเป็นโมเดลที่ใหญ่ที่สุดในชุดข้อมูลนี้ เอาชนะ o3-mini ของ OpenAI และ Gemini 2.5 Pro ของ Google บน Codeforces ซึ่งเป็นแพลตฟอร์มการแข่งขันการเขียนโปรแกรมยอดนิยม นอกจากนี้ยังทำผลงานได้ดีกว่า o3-mini ในโจทย์คณิตศาสตร์ AIME และ BFCL ซึ่งวัดความสามารถในการใช้เหตุผลของโมเดล

Qwen-3-235B-A22B ยังไม่ได้เปิดตัวอย่างเป็นทางการต่อสาธารณะ ขณะเดียวกัน ผู้ใช้สามารถดาวน์โหลด Qwen3-32B ได้ โมเดลนี้แซงหน้า OpenAI ที่ได้ o1 ในการประเมินหลายครั้ง รวมถึงการทดสอบการเขียนโปรแกรม LiveCodeBench

อาลีบาบากล่าวว่า Qwen3 โดดเด่นในด้านการเรียกใช้เครื่องมือ การปฏิบัติตามคำสั่ง และการคัดลอกรูปแบบข้อมูลอย่างแม่นยำ ซึ่งเป็นสิ่งที่เครื่องมืออื่นๆ ขาดหายไป งานวิจัยจากมหาวิทยาลัยคาร์เนกีเมลลอนแสดงให้เห็นว่า AI จำนวนมากสร้างข้อมูลและเปลี่ยนแปลงรูปแบบแม้จะมีคำสั่งเฉพาะเจาะจงก็ตาม

นอกจากการดาวน์โหลดบนแพลตฟอร์มข้างต้นแล้ว ผู้ใช้ยังสามารถค้นหา Qwen3 ผ่านผู้ให้บริการคลาวด์ เช่น Fireworks AI และ Hyperbolic ซึ่งช่วยให้ธุรกิจขนาดใหญ่และขนาดเล็ก รวมถึงโปรแกรมเมอร์รายบุคคล สามารถเข้าถึงและทดลองใช้งานได้อย่างเหนือขีดจำกัด

การเกิดขึ้นของ AI ของจีน เช่น Qwen ทำให้ห้องทดลองวิจัยของสหรัฐฯ มีแรงกดดันมากขึ้นในการพัฒนาเทคโนโลยีที่มีประสิทธิภาพมากขึ้น จนทำให้ผู้กำหนดนโยบายของสหรัฐฯ กำหนดข้อจำกัดต่อการเข้าถึงชิปของจีน

Tuhin Srivastava ซีอีโอของ Baseten บริษัทโฮสติ้ง AI บนคลาวด์ กล่าวว่า Qwen3 เป็นอีกหนึ่งตัวอย่างของโมเดลโอเพ่นซอร์สที่กำลังตามทันระบบปิดอย่าง OpenAI

Qwen3 จะยังคงได้รับความนิยมอย่างแพร่หลายในประเทศต่อไป แม้จะมีข้อจำกัดจาก รัฐบาล สหรัฐฯ ก็ตาม “นี่แสดงให้เห็นว่า นอกจากการพึ่งพาโมเดลที่มีอยู่แล้วอย่าง Anthropic และ OpenAI แล้ว บริษัทเทคโนโลยีจีนก็ยังสามารถพัฒนาซอฟต์แวร์ของตนเองได้” เขากล่าว

ที่มา: https://znews.vn/them-loat-ai-manh-me-tu-trung-quoc-post1549756.html