Vietnam.vn - Nền tảng quảng bá Việt Nam

ผลการวิจัยใหม่เผยเคล็ดลับความสำเร็จของ DeepSeek

จากข้อมูลของ DeepSeek โมเดลปัญญาประดิษฐ์ R1 ไม่ได้ถูกฝึกฝนโดยใช้ข้อมูลจากโมเดลของ OpenAI แม้ว่าจะยอมรับว่าโมเดลพื้นฐานได้รับการฝึกฝนจากข้อมูลบนเว็บ ซึ่งอาจรวมถึงเนื้อหาที่สร้างโดย AI ด้วย

VietnamPlusVietnamPlus17/09/2025

โมเดลปัญญาประดิษฐ์ R1 จากบริษัทสตาร์ทอัพสัญชาติจีน DeepSeek ซึ่งสร้างความฮือฮาในตลาดหุ้นสหรัฐฯ เมื่อเปิดตัวในเดือนมกราคม ได้ถูกเปิดเผยในงานวิจัยที่ได้รับการตรวจสอบโดยผู้เชี่ยวชาญ แสดงให้เห็นว่าบริษัทดังกล่าวพัฒนาโมเดล LLM ที่ทรงพลังได้ด้วยต้นทุนเพียงประมาณ 300,000 ดอลลาร์สหรัฐ

R1 ถูกออกแบบมาให้มีความโดดเด่นในงานด้านการคิดวิเคราะห์ เช่น คณิตศาสตร์และการเขียนโปรแกรม โดยเป็นคู่แข่งราคาประหยัดของเครื่องมือที่พัฒนาโดยบริษัทเทคโนโลยีของอเมริกา

นี่คือโมเดล "น้ำหนักไม่จำกัด" ที่สามารถดาวน์โหลดได้ฟรี และปัจจุบันเป็นโมเดลที่ได้รับความนิยมมากที่สุดบนแพลตฟอร์ม Hugging Face โดยมียอดดาวน์โหลดมากกว่า 10.9 ล้านครั้ง

งานวิจัยฉบับปรับปรุงล่าสุดที่ตีพิมพ์ในวารสาร Nature ซึ่งอ้างอิงจากบทความฉบับเดือนมกราคม เปิดเผยเป็นครั้งแรกว่า ค่าใช้จ่ายในการฝึกฝน R1 นั้นอยู่ที่เพียง 294,000 ดอลลาร์สหรัฐ นอกเหนือจากค่าใช้จ่ายประมาณ 6 ล้านดอลลาร์สหรัฐสำหรับการสร้างแบบจำลองพื้นฐาน

ตัวเลขนี้ต่ำกว่าอย่างเห็นได้ชัด เมื่อเทียบกับเงินหลายสิบล้านดอลลาร์ที่เชื่อกันว่าคู่แข่งใช้ไป

DeepSeek รายงานว่า R1 ได้รับการฝึกฝนโดยใช้ชิป Nvidia H800 เป็นหลัก ซึ่งเป็นชิปประเภทที่สหรัฐฯ ห้ามส่งออกไปยังประเทศจีนตั้งแต่ปี 2023

จุดเด่นของ R1 อยู่ที่การประยุกต์ใช้ "การเรียนรู้แบบเสริมแรงอย่างแท้จริง" ซึ่งหมายความว่าแบบจำลองจะได้รับการลองผิดลองถูกและให้รางวัลตัวเองเมื่อให้คำตอบที่ถูกต้อง แทนที่จะเรียนรู้จากตัวอย่างที่มนุษย์เลือก แบบจำลองยังประเมินความพยายามของตนเองโดยใช้การประมาณค่าภายใน ซึ่งเป็นเทคนิคที่เรียกว่า "การเพิ่มประสิทธิภาพนโยบายกลุ่มเชิงสัมพัทธ์" ซึ่งช่วยเพิ่มประสิทธิภาพให้ดียิ่งขึ้น

จากข้อมูลของนักวิจัย Huan Sun (มหาวิทยาลัยโอไฮโอสเตท) "กระบวนการตรวจสอบโดยผู้ทรงคุณวุฒิอย่างเข้มงวดช่วยยืนยันคุณค่าและความน่าเชื่อถือของแบบจำลอง บริษัทอื่นๆ ควรทำเช่นเดียวกัน"

ลูอิส ทันสตอล วิศวกรด้านการเรียนรู้ของเครื่องจักรจากบริษัท Hugging Face เชื่อว่านี่เป็นการสร้างแบบอย่างที่สำคัญ เพราะความโปร่งใสในการพัฒนา AI ช่วยให้ประเมินความเสี่ยงได้แม่นยำยิ่งขึ้น

DeepSeek ยืนยันว่า R1 ไม่ได้รับการฝึกฝนโดยใช้ข้อมูลจากโมเดลของ OpenAI แม้ว่าจะยอมรับว่าโมเดลพื้นฐานได้รับการฝึกฝนจากข้อมูลบนเว็บ ซึ่งอาจรวมถึงเนื้อหาที่สร้างโดย AI ด้วย

ผู้เชี่ยวชาญเชื่อว่า แม้จะเป็นเรื่องยากที่จะตรวจสอบได้อย่างแน่ชัด แต่หลักฐานในปัจจุบันชี้ให้เห็นว่าวิธีการเพิ่มประสิทธิภาพแบบบริสุทธิ์นั้นเพียงพอที่จะบรรลุผลลัพธ์ที่มีประสิทธิภาพสูง

ในการทดสอบประสิทธิภาพ ScienceAgentBench นั้น R1 ไม่ได้อยู่ในอันดับแรกด้านความแม่นยำ แต่ทำได้ดีในแง่ของประสิทธิภาพและต้นทุน ปัจจุบันนักวิจัยกำลังมองหาวิธีนำวิธีการของ DeepSeek ไปใช้เพื่อเพิ่มประสิทธิภาพความสามารถในการให้เหตุผลของ LLM ที่มีอยู่ รวมถึงขยายไปสู่สาขาอื่นๆ นอกเหนือจากคณิตศาสตร์และการเขียนโปรแกรม

ตามคำกล่าวของ Tunstall บริษัท R1 ได้ "ก่อให้เกิดการปฏิวัติ" ในการพัฒนาปัญญาประดิษฐ์

(VNA/เวียดนาม+)

ที่มา: https://www.vietnamplus.vn/nghien-cuu-moi-tiet-lo-bi-quyet-thanh-cong-cua-deepseek-post1062474.vnp


การแสดงความคิดเห็น (0)

กรุณาแสดงความคิดเห็นเพื่อแบ่งปันความรู้สึกของคุณ!

หัวข้อเดียวกัน

หมวดหมู่เดียวกัน

ผู้เขียนเดียวกัน

มรดก

รูป

ธุรกิจ

ข่าวสารปัจจุบัน

ระบบการเมือง

ท้องถิ่น

ผลิตภัณฑ์

Happy Vietnam
เมือง

เมือง

ความสุขในที่สูง

ความสุขในที่สูง

ห้องเรียนบนถนนเวสต์ร็อค เอ

ห้องเรียนบนถนนเวสต์ร็อค เอ