DeepSeek จุดประกายความอยากรู้อยากเห็น

บริษัท AI ของจีนได้พัฒนาวิธีการอนุมาน AI ใหม่ๆ ท่ามกลางความคาดหวังที่เพิ่มขึ้นสำหรับการสร้างแบบจำลองยุคใหม่

ZNews•07/04/2025

DeepSeek มุ่งเน้นไปที่การวิจัยและพัฒนาโมเดลใหม่ๆ มากกว่าการปรากฏตัวในสื่อบ่อยๆ ภาพ: SCMP

DeepSeek ร่วมกับนักวิจัยจากมหาวิทยาลัยชิงหัว ได้นำเสนอวิธีการใหม่เพื่อปรับปรุงความสามารถในการอนุมานของแบบจำลองภาษาขนาดใหญ่ (LLM) วิธีการนี้ได้รับการตีพิมพ์ในบทความวิจัยเมื่อเย็นวันที่ 4 เมษายน และช่วยให้ LLM สร้างผลลัพธ์ที่ดีขึ้นและเร็วขึ้นสำหรับคำถามทั่วไป

เทคนิคนี้เป็นการผสมผสานสองวิธีที่ประสบความสำเร็จก่อนหน้านี้จาก DeepSeek วิธีแรกคือการสร้างแบบจำลองรางวัลเชิงสร้างสรรค์ (Generative Reward Modeling: GRM) ซึ่งช่วยให้แบบจำลอง AI สามารถประเมินตนเองและปรับปรุงการตอบสนองโดยอิงจากผลลัพธ์ก่อนหน้า และอีกวิธีหนึ่งคือการปรับแต่งการวิจารณ์อย่างมีหลักการ

ทั้งสองวิธีนี้อาศัยคุณสมบัติ "การเรียนรู้ด้วยตนเอง" ของ AI ซึ่งช่วยลดการพึ่งพาคำติชมหรือคำแนะนำโดยตรงจากมนุษย์ แต่มีเป้าหมายเพื่อให้ได้ผลลัพธ์ที่ใกล้เคียงกับความคาดหวังของมนุษย์มากขึ้น

นักวิจัยระบุว่า แม้จะเป็นวิธีการใหม่ แต่ DeepSeek-GRM ก็ให้ผลลัพธ์ที่โดดเด่นและสามารถแข่งขันกับโมเดล AI ที่เป็นที่รู้จักและมีประสิทธิภาพมากที่สุดในปัจจุบันได้ DeepSeek วางแผนที่จะเปิดเผยซอร์สโค้ดของโมเดล GRM แต่ยังไม่ได้กำหนดกรอบเวลาที่แน่นอน

หลังจากสร้างผลกระทบไปทั่วโลกด้วยโมเดลแพลตฟอร์ม V3 และโมเดลการอนุมาน R1 แล้ว DeepSeek ได้เผยแพร่บทความทางวิชาการนี้บนคลังเก็บข้อมูล ทางวิทยาศาสตร์ ออนไลน์ arXiv ซึ่งจุดประกายความอยากรู้เกี่ยวกับก้าวต่อไปของบริษัท

สำนักข่าวรอยเตอร์ คาดการณ์ว่า DeepSeek-R2 ซึ่งเป็นรุ่นต่อจาก R1 อาจเปิดตัวในเดือนเมษายน เนื่องจากรุ่นก่อนหน้ายังคงได้รับความนิยมอย่างต่อเนื่อง DeepSeek-R1 เคยสร้างความฮือฮาไปทั่วโลกในวงการเทคโนโลยีด้วยประสิทธิภาพที่เหนือกว่าเมื่อเทียบกับราคา ทำให้สามารถแข่งขันกับรุ่นชั้นนำในปัจจุบันได้

DeepSeek ยังคงเงียบเกี่ยวกับข่าวลือดังกล่าว อย่างไรก็ตาม แหล่งข่าวในท้องถิ่นระบุว่า บัญชีฝ่ายบริการลูกค้าของ DeepSeek ได้ปฏิเสธข้อมูลดังกล่าวในกลุ่มแชทกับลูกค้าระดับองค์กร

DeepSeek ก่อตั้งขึ้นในเมืองหางโจวในปี 2023 โดยผู้ประกอบการ Liang Wenfeng และได้รับความสนใจจากทั่วโลกอย่างรวดเร็วในช่วงไม่กี่เดือนที่ผ่านมา แต่แทนที่จะใช้ประโยชน์จากชื่อเสียงที่ได้รับ บริษัทกลับมุ่งเน้นทรัพยากรไปที่การวิจัยและพัฒนา

ก่อนหน้านี้ DeepSeek ได้อัปเกรดโมเดล V3 โดยปล่อยเวอร์ชัน DeepSeek-V3-0324 ออกมา ตามประกาศ การอัปเดตนี้มีคุณสมบัติที่ได้รับการปรับปรุงในด้านความสามารถในการให้เหตุผล การเพิ่มประสิทธิภาพสำหรับการพัฒนาส่วนติดต่อผู้ใช้บนเว็บ และทักษะการเขียนภาษาจีนที่ดีขึ้น

ในเดือนกุมภาพันธ์ สตาร์ทอัพแห่งนี้ยังได้เปิดเผยซอร์สโค้ดของห้าคลังข้อมูล เพื่อยืนยันถึงความมุ่งมั่นในการ "พัฒนาด้วยความโปร่งใสอย่างเต็มที่" นอกจากนี้ ในเดือนเดียวกัน บริษัทยังได้ประกาศการศึกษาทางเทคนิคเกี่ยวกับ "กลไกการให้ความสนใจแบบเบาบาง (native sparse attention)" ซึ่งช่วยปรับปรุงประสิทธิภาพของ LLM ในการจัดการข้อมูลจำนวนมหาศาล

DeepSeek ถูกมองว่าเป็นสัญลักษณ์ของความมีชีวิตชีวาของอุตสาหกรรม AI ของจีน ในขณะที่สหรัฐฯ พยายามที่จะสกัดกั้นการพัฒนาทางเทคโนโลยีของประเทศ

ที่มา: https://znews.vn/deepseek-gay-to-mo-post1543900.html