ในรายงาน DeepSeek ระบุว่าต้นทุนการฝึกอบรมทั้งหมดอยู่ที่ 5.576 ล้านดอลลาร์ ซึ่งส่วนใหญ่เป็นผลมาจากราคาเช่าหน่วยประมวลผลกราฟิกของ Nvidia บริษัทยังเตือนด้วยว่าตัวเลขนี้สะท้อนถึง “การฝึกอบรมอย่างเป็นทางการ” เท่านั้น และไม่รวมต้นทุนที่เกี่ยวข้องกับการวิจัยหรือการทดลองก่อนหน้านี้เกี่ยวกับสถาปัตยกรรม อัลกอริทึม และข้อมูล สิ่งนี้ดึงดูดนักลงทุนทันที และทำให้หุ้นบริษัทเทคโนโลยีระดับโลก "ระเหย" ไปถึง 1,000 พันล้านดอลลาร์สหรัฐ ในเวลาเพียงวันเดียว คือวันที่ 27 มกราคม
ต้นทุนการดำเนินงานของ DeepSeek สูงกว่าที่อ้างมากหรือไม่?
ขณะนี้ รายงานจากบริษัทวิจัยและให้คำปรึกษาด้านเซมิคอนดักเตอร์ SemiAnalysis นำเสนอมุมมองใหม่อีกครั้งเกี่ยวกับต้นทุนในการพัฒนา DeepSeek บริษัทประมาณการว่าค่าใช้จ่ายด้านฮาร์ดแวร์ของ DeepSeek จะสูงกว่าที่คิดมาก โดยเน้นย้ำว่าต้นทุนการวิจัยและพัฒนา (R&D) และต้นทุนรวมในการเป็นเจ้าของนั้นมีความสำคัญ
SemiAnalysis กล่าวว่าการสร้าง "ข้อมูลสังเคราะห์" สำหรับโมเดลการฝึกอบรมจะต้องใช้ "การคำนวณจำนวนมาก" นอกจากนี้ บริษัทต่างๆ ยังต้องทำการทดลอง พัฒนาสถาปัตยกรรมใหม่ รวบรวมและทำความสะอาดข้อมูล และจ่ายเงินพนักงานด้วย
DeepSeek ต้องใช้ GPU 50,000 ตัวแทนที่จะเป็นเพียง 2,000 ตัวเท่านั้น?
ตามการคำนวณ ผู้เชี่ยวชาญระบุว่า DeepSeek ใช้งานระบบคอมพิวเตอร์ขนาดใหญ่ที่ประกอบด้วย Hopper GPU ประมาณ 50,000 ตัว พร้อมด้วย H800 GPU จำนวน 10,000 ตัว และ H100 GPU ที่ทรงพลังกว่าอีก 10,000 ตัว พร้อมทั้ง H20 GPU เพิ่มเติมด้วย ตัวเลขนี้ขัดแย้งกับข้ออ้างก่อนหน้านี้ของ DeepSeek ที่ว่าจะใช้ GPU Nvidia เพียง 2,048 ตัวเท่านั้น ค่าใช้จ่ายด้านทุนทั้งหมดสำหรับเซิร์ฟเวอร์ประมาณการอยู่ที่ 1.6 พันล้านดอลลาร์ ในขณะที่ค่าใช้จ่ายในการดำเนินงานมีจำนวนอยู่ที่ 944 ล้านดอลลาร์
SemiAnalysis เชื่อว่า DeepSeek ใช้ GPU Nvidia จำนวน 50,000 ตัว
DeepSeek ก่อตั้งขึ้นในปี 2023 โดย Luong Van Phong ผู้ก่อตั้งร่วมของ High-Flyer กองทุนป้องกันความเสี่ยงที่เน้น AI ในประเทศจีน สตาร์ทอัพเติบโตจากหน่วยวิจัย AI ของกองทุนในเดือนเมษายน 2023 โดยมีเป้าหมายเพื่อพัฒนาโมเดลภาษาขนาดใหญ่และบรรลุปัญญาประดิษฐ์ทั่วไป (AGI)
ความสนใจใน DeepSeek เพิ่มขึ้นเมื่อบริษัทเปิดตัว R1 ซึ่งเป็นโมเดลการใช้เหตุผลที่แข่งขันกับ o1 ของ OpenAI แต่ได้รับการเสนอให้เป็นโอเพนซอร์ส ทำให้ผู้พัฒนา AI รายใดก็ตามสามารถใช้งานได้ อย่างไรก็ตาม เช่นเดียวกับแชทบอตจีนอื่นๆ DeepSeek ยังมีข้อจำกัดในหัวข้อบางหัวข้อเช่นกัน
Sam Altman ซีอีโอของ OpenAI ชื่นชมโมเดลของ DeepSeek และระบุว่า DeepSeek เป็น "โมเดลที่ยอดเยี่ยมอย่างชัดเจน" อย่างไรก็ตาม เขายังกล่าวอีกว่ามีหลักฐานว่า DeepSeek รวบรวมข้อมูลของ OpenAI เพื่อทำงานในลักษณะ "กลั่นกรอง"
ที่มา: https://thanhnien.vn/chi-phi-phat-trien-deepseek-bi-tang-boc-185250203151508438.htm
การแสดงความคิดเห็น (0)