รายงานทางเทคนิคฉบับใหม่จาก SCMP ระบุว่าโปรเซสเซอร์ AI Ascend ของ Huawei มีประสิทธิภาพแซงหน้า GPU ของ Nvidia ในการทดสอบโมเดลปัญญาประดิษฐ์ DeepSeek R1 ผลลัพธ์นี้ถือเป็นก้าวสำคัญของบริษัทจีนในการเผชิญกับคำสั่งควบคุมเทคโนโลยีจากสหรัฐอเมริกา
เอกสารที่เขียนร่วมกันโดยนักวิจัยจาก Huawei และ SiliconFlow ซึ่งเป็นบริษัทสตาร์ทอัพด้านโครงสร้างพื้นฐาน AI ได้ให้รายละเอียดเกี่ยวกับสถาปัตยกรรมของศูนย์ข้อมูล CloudMatrix 384 ซึ่งเป็น “ระบบซูเปอร์ระบบ AI บนชิป” ที่ออกแบบมาโดยเฉพาะเพื่อจัดการกับปริมาณงานมหาศาลจากโมเดลภาษาขนาดใหญ่ (LLM)
CloudMatrix 384 ประกอบด้วยโปรเซสเซอร์ Ascend 910C จำนวน 384 ตัวและ CPU Kunpeng จำนวน 192 ตัว เชื่อมต่อกันด้วยระบบบัสรวมที่มีค่าความหน่วงต่ำและแบนด์วิดท์สูง คาดว่า Huawei จะใช้สถาปัตยกรรมนี้ในการปรับโครงสร้างรากฐานของโครงสร้างพื้นฐาน AI
ระบบ CloudMatrix-Infer ที่สร้างขึ้นบนแพลตฟอร์มนี้แสดงให้เห็นถึงประสิทธิภาพที่โดดเด่นเมื่อใช้งานโมเดล DeepSeek R1 ในระยะพรีฟิล ระบบสามารถบรรลุอัตราข้อมูล 6,688 โทเค็นต่อวินาทีต่อ NPU เมื่อประมวลผลคำขอ 4,000 โทเค็นจากผู้ใช้ ประสิทธิภาพนี้เทียบเท่ากับ 4.45 โทเค็นต่อวินาทีต่อ TFLOPS (ล้านล้านการดำเนินการต่อวินาที)
ในระหว่างขั้นตอนการถอดรหัส CloudMatrix บันทึกปริมาณงานได้ 1,943 โทเค็นต่อวินาทีต่อ NPU โดยมีเวลาตอบสนองน้อยกว่า 50 มิลลิวินาทีต่อโทเค็น ประสิทธิภาพที่ 1.29 โทเค็นต่อวินาทีต่อ TFLOPS นี้สูงกว่าระบบ SGLang ของ Nvidia ที่ใช้ GPU H100 และแพลตฟอร์ม GPU H800 ที่รัน DeepSeek R1
ตามที่ Zuo Pengfei ผู้เขียนหลักของการศึกษาวิจัยและสมาชิกของโครงการ "Genius Youth" ของ Huawei กล่าวไว้ว่า จุดมุ่งหมายของรายงานฉบับนี้คือการช่วยให้ภาคอุตสาหกรรมเข้าใจถึงความสามารถของ Ascend NPU ที่พัฒนาโดยจีนได้อย่างเต็มที่ เขาได้ยืนยันบนแพลตฟอร์ม Zhihu ว่ารายงานฉบับนี้เป็นการแสดงให้เห็นอย่างชัดเจนถึงความสามารถทางเทคโนโลยีของ Huawei CloudMatrix
นี่เป็นครั้งแรกที่ Huawei เปิดเผยรายละเอียดทางเทคนิคเกี่ยวกับเครื่องเร่งความเร็ว AI รุ่น Ascend 910C นอกจากนี้ รายงานดังกล่าวยังย้ำถึงคำพูดล่าสุดของ Ren Zhengfei ผู้ก่อตั้ง Huawei ที่ว่าชิปรุ่น Ascend ยังคงตามหลังชิปรุ่นอื่นๆ ในสหรัฐอเมริกาอยู่ “หนึ่งรุ่น” อย่างไรก็ตาม เขาอ้างว่าการประยุกต์ใช้แนวทางต่างๆ เช่น “การซ้อนและการจัดกลุ่ม” ช่วยให้ Huawei บรรลุประสิทธิภาพการประมวลผลที่เทียบเคียงได้กับระบบ AI ขั้นสูงที่สุดในปัจจุบัน
ในขณะเดียวกัน เจนเซ่น หวง ซีอีโอของ Nvidia ยอมรับในบทสัมภาษณ์กับ CNBC ว่า AI เป็นปัญหาด้านการประมวลผลแบบขนาน และพวกเขาจะต้องมีโปรเซสเซอร์เพิ่มมากขึ้น หากไม่มีพลังการประมวลผลเพียงพอ
ที่มา: https://znews.vn/buoc-tien-lon-cua-huawei-post1562828.html
การแสดงความคิดเห็น (0)