Vietnam.vn - Nền tảng quảng bá Việt Nam

DeepSeek เปิดเผยความลับ

DeepSeek เปิดเผยเป็นครั้งแรกถึงวิธีการสร้างโมเดล AI โอเพ่นซอร์สชั้นนำของโลกด้วยต้นทุนต่ำ โดยอาศัยการออกแบบฮาร์ดแวร์และซอฟต์แวร์พร้อมกัน

ZNewsZNews19/05/2025

DeepSeek เผยวิธีสร้างโมเดล AI ราคาถูก ภาพ: Bloomberg

ในรายงานการวิจัยที่เผยแพร่เมื่อวันที่ 15 พฤษภาคม DeepSeek ได้เปิดเผยรายละเอียดเป็นครั้งแรกเกี่ยวกับวิธีการสร้างระบบ AI โอเพ่นซอร์สที่ทรงพลังที่สุดระบบหนึ่งของโลก ด้วยต้นทุนเพียงเศษเสี้ยวหนึ่งของคู่แข่ง

การศึกษาที่มีชื่อว่า “Insights into DeepSeek-V3: Scaling Challenges and Reflections on Hardware for AI Architectures” ร่วมกันเขียนโดย Liang Wenfeng ผู้ก่อตั้ง DeepSeek ระบุว่าความสำเร็จเกิดจากการออกแบบฮาร์ดแวร์และซอฟต์แวร์ควบคู่กันไป ซึ่งเป็นแนวทางที่แตกต่างจากบริษัทหลายแห่งที่มุ่งเน้นการปรับแต่งซอฟต์แวร์แบบแยกส่วน

“DeepSeek-V3 ซึ่งฝึกฝนบน GPU Nvidia H800 จำนวน 2,048 ตัว แสดงให้เห็นว่าการออกแบบแบบขนานสามารถรับมือกับความท้าทายเหล่านี้ได้อย่างมีประสิทธิภาพ ช่วยให้สามารถฝึกฝนและอนุมานได้อย่างมีประสิทธิภาพในระดับขนาดใหญ่” ทีมวิจัยเขียนไว้ในรายงาน DeepSeek และกองทุนเฮดจ์ฟันด์ High-Flyer ได้สะสมชิป H800 ไว้ก่อนที่สหรัฐอเมริกาจะห้ามการส่งออกไปยังจีนในปี 2023

ทีมงาน DeepSeek ตระหนักถึงข้อจำกัดของฮาร์ดแวร์และ "ต้นทุนที่สูงเกินจริง" ในการฝึกโมเดลภาษาขนาดใหญ่ (LLM) ซึ่งเป็นเทคโนโลยีพื้นฐานเบื้องหลังแชทบอท เช่น ChatGPT ของ OpenAI จึงได้นำการปรับปรุงทางเทคนิคชุดหนึ่งมาใช้ เพื่อเพิ่มประสิทธิภาพหน่วยความจำ ปรับปรุงการสื่อสารระหว่างชิป และปรับปรุงประสิทธิภาพของโครงสร้างพื้นฐาน AI ทั้งหมด ตามที่ระบุในเอกสาร

นอกจากนี้ DeepSeek ยังเน้นย้ำบทบาทของสถาปัตยกรรม Model of Expert (MoE) ซึ่งเป็นวิธีการเรียนรู้ของเครื่องจักรที่แบ่งโมเดล AI ออกเป็นเครือข่ายย่อย โดยแต่ละเครือข่ายจะประมวลผลข้อมูลอินพุตแยกกัน และทำงานร่วมกันเพื่อปรับผลลัพธ์ให้เหมาะสมที่สุด

กระทรวงศึกษาธิการ (MoE) ลดต้นทุนการฝึกอบรมและเพิ่มความเร็วในการอนุมาน ปัจจุบันวิธีการนี้ได้รับการนำไปใช้อย่างแพร่หลายในอุตสาหกรรมเทคโนโลยีของจีน รวมถึงโมเดล Qwen3 ล่าสุดของอาลีบาบา

DeepSeek กลายเป็นข่าวพาดหัวเมื่อเปิดตัวโมเดลพื้นฐาน V3 ในเดือนธันวาคม 2024 และโมเดลการใช้เหตุผล R1 ในเดือนมกราคม ผลิตภัณฑ์เหล่านี้สร้างความปั่นป่วนในตลาดโลก ส่งผลให้หุ้นเทคโนโลยีที่เกี่ยวข้องกับ AI ร่วงลงอย่างหนัก

แม้ว่า DeepSeek จะยังไม่ได้เปิดเผยแผนการเพิ่มเติมใดๆ ในช่วงที่ผ่านมา แต่บริษัทก็ยังคงให้ความสนใจกับชุมชนด้วยการเผยแพร่รายงานอย่างสม่ำเสมอ ในช่วงปลายเดือนมีนาคม บริษัทได้เปิดตัวอัปเดตย่อยสำหรับ DeepSeek-V3 และในช่วงปลายเดือนเมษายน บริษัทได้เปิดตัวระบบ Prover-V2 สำหรับการประมวลผลการพิสูจน์ทางคณิตศาสตร์อย่างเงียบๆ

ที่มา: https://znews.vn/deepseek-tiet-lo-bi-mat-post1554222.html


การแสดงความคิดเห็น (0)

No data
No data
ฉากมหัศจรรย์บนเนินชา 'ชามคว่ำ' ในฟู้โถ
3 เกาะในภาคกลางเปรียบเสมือนมัลดีฟส์ ดึงดูดนักท่องเที่ยวในช่วงฤดูร้อน
ชมเมืองชายฝั่ง Quy Nhon ของ Gia Lai ที่เป็นประกายระยิบระยับในยามค่ำคืน
ภาพทุ่งนาขั้นบันไดในภูทอ ลาดเอียงเล็กน้อย สดใส สวยงาม เหมือนกระจกก่อนฤดูเพาะปลูก
โรงงาน Z121 พร้อมแล้วสำหรับงาน International Fireworks Final Night
นิตยสารท่องเที่ยวชื่อดังยกย่องถ้ำซอนดุงว่าเป็น “ถ้ำที่งดงามที่สุดในโลก”
ถ้ำลึกลับดึงดูดนักท่องเที่ยวชาวตะวันตก เปรียบเสมือน 'ถ้ำฟองญา' ในทัญฮว้า
ค้นพบความงดงามอันน่ารื่นรมย์ของอ่าว Vinh Hy
ชาที่มีราคาแพงที่สุดในฮานอย ซึ่งมีราคาสูงกว่า 10 ล้านดองต่อกิโลกรัม ได้รับการแปรรูปอย่างไร?
รสชาติแห่งภูมิภาคสายน้ำ

มรดก

รูป

ธุรกิจ

No videos available

ข่าว

ระบบการเมือง

ท้องถิ่น

ผลิตภัณฑ์