ในรายงาน DeepSeek ระบุว่าต้นทุนการฝึกอบรมทั้งหมดอยู่ที่ 5.576 ล้านดอลลาร์ ซึ่งส่วนใหญ่มาจากค่าเช่าหน่วยประมวลผลกราฟิกของ Nvidia นอกจากนี้ บริษัทยังเตือนด้วยว่าตัวเลขนี้สะท้อนให้เห็นเฉพาะ "การฝึกอบรมอย่างเป็นทางการ" เท่านั้น และไม่รวมต้นทุนที่เกี่ยวข้องกับการวิจัยหรือการทดลองก่อนหน้านี้เกี่ยวกับสถาปัตยกรรม อัลกอริทึม และข้อมูล ซึ่งดึงดูดนักลงทุนได้ทันทีและทำให้หุ้นเทคโนโลยีทั่วโลก "ระเหย" มูลค่า 1,000 พันล้านดอลลาร์ในเวลาเพียงวันเดียวเมื่อวันที่ 27 มกราคม
ต้นทุนการดำเนินงานของ DeepSeek สูงกว่าที่อ้างมากหรือไม่?
ปัจจุบัน รายงานจากบริษัทวิจัยและให้คำปรึกษาด้านเซมิคอนดักเตอร์ SemiAnalysis เสนอมุมมองที่แตกต่างเกี่ยวกับต้นทุนการพัฒนาของ DeepSeek บริษัทประเมินว่าค่าใช้จ่ายด้านฮาร์ดแวร์ของ DeepSeek สูงกว่าที่อ้างมาก โดยระบุว่าการวิจัยและพัฒนาและต้นทุนรวมในการเป็นเจ้าของนั้นมีความสำคัญ
SemiAnalysis กล่าวว่าการสร้าง "ข้อมูลสังเคราะห์" สำหรับโมเดลการฝึกอบรมจะต้องใช้ "พลังการประมวลผลจำนวนมาก" นอกจากนี้ บริษัทต่างๆ จะต้องทดลอง พัฒนาสถาปัตยกรรมใหม่ รวบรวมและทำความสะอาดข้อมูล และจ่ายเงินให้กับพนักงาน
DeepSeek ต้องใช้ GPU 50,000 ตัวแทนที่จะเป็นเพียง 2,000 ตัวเท่านั้น?
จากการคำนวณ ผู้เชี่ยวชาญระบุว่า DeepSeek ใช้งานระบบคอมพิวเตอร์ขนาดใหญ่ที่ประกอบด้วย GPU Hopper ประมาณ 50,000 ตัว GPU H800 จำนวน 10,000 ตัว และ GPU H100 ที่มีประสิทธิภาพมากกว่า 10,000 ตัว พร้อมด้วย GPU H20 เพิ่มเติม ตัวเลขนี้ขัดแย้งกับคำกล่าวอ้างก่อนหน้านี้ของ DeepSeek ที่ใช้ GPU Nvidia เพียง 2,048 ตัว ค่าใช้จ่ายด้านทุนทั้งหมดสำหรับเซิร์ฟเวอร์นี้ประมาณอยู่ที่ 1.6 พันล้านดอลลาร์ ในขณะที่ต้นทุนการดำเนินงานสูงถึง 944 ล้านดอลลาร์
SemiAnalysis เชื่อว่า DeepSeek ใช้ GPU Nvidia จำนวน 50,000 ตัว
DeepSeek ก่อตั้งขึ้นในปี 2023 โดย Liang Wenfeng ผู้ก่อตั้งร่วมของ High-Flyer ซึ่งเป็นกองทุนป้องกันความเสี่ยงที่เน้นด้าน AI ของจีน สตาร์ทอัพแห่งนี้เติบโตมาจากหน่วยวิจัย AI ของกองทุนในเดือนเมษายน 2023 โดยมีเป้าหมายในการพัฒนาโมเดลภาษาขนาดใหญ่และบรรลุปัญญาประดิษฐ์ทั่วไป (AGI)
ความสนใจใน DeepSeek เพิ่มขึ้นเมื่อบริษัทเปิดตัว R1 ซึ่งเป็นโมเดลการใช้เหตุผลที่แข่งขันกับ o1 ของ OpenAI แต่เป็นโอเพนซอร์ส ทำให้ผู้พัฒนา AI ทุกคนสามารถใช้งานได้ อย่างไรก็ตาม เช่นเดียวกับแชทบ็อตอื่นๆ ของจีน DeepSeek ก็มีข้อจำกัดในบางหัวข้อเช่นกัน
Sam Altman ซีอีโอของ OpenAI ชื่นชมโมเดลของ DeepSeek และระบุว่า DeepSeek เป็น "โมเดลที่ยอดเยี่ยม" อย่างชัดเจน อย่างไรก็ตาม เขายังได้กล่าวอีกว่ามีหลักฐานที่บ่งชี้ว่า DeepSeek ได้รวบรวมข้อมูลของ OpenAI เพื่อนำไปใช้ในลักษณะ "กลั่นกรอง"
ที่มา: https://thanhnien.vn/chi-phi-phat-trien-deepseek-bi-tang-boc-185250203151508438.htm
การแสดงความคิดเห็น (0)