DeepSeek มุ่งเน้นไปที่การวิจัยและการพัฒนาโมเดลใหม่ๆ มากกว่าที่จะปรากฏตัวในสื่อมากนัก ภาพโดย: SCMP |
DeepSeek ร่วมมือกับนักวิจัยจากมหาวิทยาลัย Tsinghua เปิดตัววิธีการใหม่เพื่อปรับปรุงความสามารถในการอนุมานของโมเดลภาษาขนาดใหญ่ (LLM) วิธีการดังกล่าวซึ่งตีพิมพ์ในเอกสารการวิจัยเมื่อวันที่ 4 เมษายน ช่วยให้ LLM ผลิตผลลัพธ์ที่ดีขึ้นและรวดเร็วขึ้นสำหรับแบบสอบถามทั่วไป
เทคนิคนี้เป็นการผสมผสานระหว่างสองวิธี DeepSeek ที่ประสบความสำเร็จมาแล้ว วิธีหนึ่งคือการสร้างแบบจำลองรางวัลเชิงสร้างสรรค์ (GRM) ซึ่งช่วยให้โมเดล AI สามารถประเมินตัวเองและปรับแต่งคำตอบตามผลลัพธ์ก่อนหน้าได้ และอีกวิธีหนึ่งคือการปรับแต่งการวิจารณ์ตามหลักการของตนเอง
ทั้งสองวิธีนี้จะอาศัยองค์ประกอบ "การเรียนรู้ด้วยตนเอง" ของ AI ซึ่งลดการพึ่งพาการตอบรับหรือคำแนะนำโดยตรงจากมนุษย์ แต่ก็มีความต้องการที่จะให้ผลลัพธ์ที่ใกล้เคียงกับความคาดหวังของมนุษย์มากขึ้น
ตามที่นักวิจัยได้กล่าวไว้ แม้ว่า DeepSeek-GRM จะเป็นวิธีใหม่ แต่ก็ยังคงให้ประสิทธิภาพที่โดดเด่นและสามารถแข่งขันกับโมเดล AI ที่มีชื่อเสียงและมีประสิทธิผลสูงสุดในปัจจุบันได้ DeepSeek มีแผนที่จะโอเพ่นซอร์สโมเดล GRM แต่ยังไม่ได้ระบุระยะเวลาที่แน่ชัด
หลังจากสร้างกระแสไปทั่วโลกด้วยโมเดลแพลตฟอร์ม V3 และโมเดลอนุมาน R1 แล้ว DeepSeek ก็ได้เผยแพร่บทความวิชาการนี้บนคลัง ข้อมูลวิทยาศาสตร์ ออนไลน์ที่ชื่อว่า arXiv ทำให้หลายๆ คนเกิดความอยากรู้เกี่ยวกับการดำเนินการครั้งต่อไปของบริษัท
สำนักข่าวรอยเตอร์ คาดการณ์ว่า DeepSeek-R2 ซึ่งเป็นรุ่นต่อจาก R1 อาจเปิดตัวได้ในเดือนเมษายน เนื่องจากรุ่นก่อนหน้ายังไม่ร้อนเท่าไหร่นัก ก่อนหน้านี้ DeepSeek-R1 ได้สร้างความตกตะลึงให้กับโลกเทคโนโลยีระดับโลก ด้วยประสิทธิภาพที่โดดเด่นเมื่อเทียบกับต้นทุน ซึ่งถือว่าสามารถแข่งขันกับรุ่นชั้นนำในปัจจุบันได้
DeepSeek ยังคงนิ่งเงียบต่อการคาดเดาดังกล่าว อย่างไรก็ตาม ตามข้อมูลในท้องถิ่น บัญชีฝ่ายดูแลลูกค้าของ DeepSeek ปฏิเสธข้อมูลข้างต้นในกลุ่มสนทนากับลูกค้าองค์กร
DeepSeek ก่อตั้งขึ้นที่เมืองหางโจวในปี 2023 โดยผู้ประกอบการ Liang Wenfeng และได้รับความสนใจจากทั่วโลกอย่างรวดเร็วในช่วงไม่กี่เดือนที่ผ่านมา แต่แทนที่จะแสวงหารายได้จากชื่อเสียงสาธารณะ บริษัทกลับเน้นทรัพยากรไปที่การวิจัยและพัฒนา
ก่อนหน้านี้ DeepSeek ได้อัปเกรดโมเดล V3 โดยเปิดตัวเวอร์ชัน DeepSeek-V3-0324 ตามการประกาศ การอัปเดตนี้จะมีคุณสมบัติการอนุมานที่ได้รับการปรับปรุง เพิ่มประสิทธิภาพสำหรับการพัฒนาเว็บส่วนหน้า และปรับปรุงการเขียนภาษาจีน
ในเดือนกุมภาพันธ์ บริษัทสตาร์ทอัพแห่งนี้ยังได้เปิดซอร์สคลังเก็บโค้ดจำนวนห้าแห่ง ซึ่งเป็นการยืนยันถึงความมุ่งมั่นที่จะ "ดำเนินไปข้างหน้าด้วยความโปร่งใสอย่างเต็มที่" นอกจากนี้ ในเดือนนี้ บริษัทได้เผยแพร่เอกสารทางเทคนิคเรื่อง “การใส่ใจแบบเบาบางแบบดั้งเดิม” ซึ่งช่วยปรับปรุงประสิทธิภาพของ LLM ในการประมวลผลข้อมูลจำนวนมหาศาล
DeepSeek ถูกมองว่าเป็นสัญลักษณ์แห่งความยืดหยุ่นของอุตสาหกรรม AI ของจีน ท่ามกลางความพยายามของสหรัฐฯ ที่จะยับยั้งการพัฒนาด้านเทคโนโลยีของประเทศ
ที่มา: https://znews.vn/deepseek-gay-to-mo-post1543900.html
การแสดงความคิดเห็น (0)