ในรายงานของ DeepSeek ระบุว่า ต้นทุนการฝึกอบรมทั้งหมดอยู่ที่ 5.576 ล้านดอลลาร์สหรัฐ ซึ่งส่วนใหญ่เกิดจากค่าเช่าหน่วยประมวลผลกราฟิกของ Nvidia บริษัทฯ ยังเตือนด้วยว่า ตัวเลขนี้สะท้อนเฉพาะ "การฝึกอบรมอย่างเป็นทางการ" เท่านั้น และไม่รวมต้นทุนที่เกี่ยวข้องกับการวิจัยหรือการทดลองก่อนหน้านี้เกี่ยวกับสถาปัตยกรรม อัลกอริทึม และข้อมูล เรื่องนี้ดึงดูดความสนใจของนักลงทุนทันที และส่งผลให้ราคาหุ้นของบริษัทเทคโนโลยีทั่วโลกร่วงลงถึง 1 ล้านล้านดอลลาร์สหรัฐในวันที่ 27 มกราคมเพียงวันเดียว
ต้นทุนการดำเนินงานของ DeepSeek สูงกว่าที่พวกเขากล่าวอ้างมากใช่หรือไม่?
ล่าสุด รายงานจากบริษัทวิจัยและให้คำปรึกษาด้านเซมิคอนดักเตอร์ SemiAnalysis นำเสนอมุมมองที่แตกต่างออกไปเกี่ยวกับต้นทุนการพัฒนาของ DeepSeek บริษัทดังกล่าวประเมินว่าค่าใช้จ่ายด้านฮาร์ดแวร์ของ DeepSeek สูงกว่าที่เคยระบุไว้มาก นอกจากนี้ยังเน้นย้ำถึงต้นทุนการวิจัยและพัฒนา (R&D) และต้นทุนรวมในการเป็นเจ้าของที่สูงมากอีกด้วย
SemiAnalysis ระบุว่า การสร้าง "ข้อมูลสังเคราะห์" สำหรับการฝึกโมเดลนั้น จะต้องใช้ "ความพยายามในการคำนวณอย่างมาก" นอกจากนี้ บริษัทต่างๆ ยังต้องทดสอบและพัฒนาสถาปัตยกรรมใหม่ รวบรวมและทำความสะอาดข้อมูล และจ่ายเงินเดือนพนักงานอีกด้วย
DeepSeek จำเป็นต้องใช้ GPU 50,000 ตัว แทนที่จะเป็นแค่ 2,000 ตัวใช่หรือไม่?
จากการคำนวณของผู้เชี่ยวชาญระบุว่า DeepSeek ดำเนินการระบบประมวลผลขนาดใหญ่ที่ประกอบด้วย GPU Hopper ประมาณ 50,000 ตัว โดยมี GPU H800 จำนวน 10,000 ตัว และ GPU H100 ที่ทรงพลังกว่าอีก 10,000 ตัว รวมถึง GPU H20 เพิ่มเติม ซึ่งขัดแย้งกับคำกล่าวอ้างก่อนหน้านี้ของ DeepSeek ที่ว่าใช้ GPU Nvidia เพียง 2,048 ตัวเท่านั้น ต้นทุนรวมของเซิร์ฟเวอร์คาดว่าจะอยู่ที่ประมาณ 1.6 พันล้านดอลลาร์ ในขณะที่ต้นทุนการดำเนินงานอยู่ที่ 944 ล้านดอลลาร์
SemiAnalysis เชื่อว่า DeepSeek ใช้ GPU ของ Nvidia จำนวน 50,000 ตัว
DeepSeek ก่อตั้งขึ้นในปี 2023 โดยเหลียง เหวินเฟิง ผู้ร่วมก่อตั้ง High-Flyer ซึ่งเป็นกองทุนเฮดจ์ฟันด์ที่เน้นด้านปัญญาประดิษฐ์ในประเทศจีน สตาร์ทอัพนี้พัฒนามาจากหน่วยวิจัยปัญญาประดิษฐ์ของกองทุนในเดือนเมษายน 2023 โดยมีเป้าหมายเพื่อพัฒนารูปแบบภาษาขนาดใหญ่และบรรลุปัญญาประดิษฐ์ทั่วไป (AGI)
ความสนใจใน DeepSeek เพิ่มขึ้นเมื่อบริษัทเปิดตัว R1 ซึ่งเป็นโมเดลการให้เหตุผลที่สามารถแข่งขันกับ o1 ของ OpenAI ได้ แต่เปิดให้ใช้งานแบบโอเพนซอร์ส ทำให้ผู้พัฒนา AI รายใดก็ได้สามารถใช้งานได้ อย่างไรก็ตาม เช่นเดียวกับแชทบอทจีนอื่นๆ DeepSeek ก็มีข้อจำกัดในบางหัวข้อเช่นกัน
แซม อัลท์แมน ซีอีโอของ OpenAI ชื่นชมโมเดลของ DeepSeek โดยเน้นย้ำว่า "เป็นโมเดลที่ยอดเยี่ยมอย่างเห็นได้ชัด" อย่างไรก็ตาม เขายังกล่าวอีกว่า มีหลักฐานที่บ่งชี้ว่า DeepSeek รวบรวมข้อมูลของ OpenAI เพื่อใช้งานโดยใช้วิธี "การกลั่นกรอง"
[โฆษณา_2]
ที่มา: https://thanhnien.vn/chi-phi-phat-trien-deepseek-bi-tang-boc-185250203151508438.htm






การแสดงความคิดเห็น (0)