Vietnam.vn - Nền tảng quảng bá Việt Nam

DeepSeek อยากรู้

บริษัท AI ของจีนได้พัฒนาวิธีการอนุมาน AI ใหม่ ท่ามกลางความคาดหวังที่เพิ่มขึ้นสำหรับโมเดลรุ่นถัดไป

Zing NewsZing News07/04/2025

DeepSeek มุ่งเน้นไปที่การวิจัยและการพัฒนาโมเดลใหม่ๆ มากกว่าที่จะปรากฏตัวในสื่อมากนัก ภาพโดย: SCMP

DeepSeek ร่วมมือกับนักวิจัยจากมหาวิทยาลัย Tsinghua เปิดตัววิธีการใหม่เพื่อปรับปรุงความสามารถในการอนุมานของโมเดลภาษาขนาดใหญ่ (LLM) วิธีการดังกล่าวซึ่งตีพิมพ์ในเอกสารการวิจัยเมื่อวันที่ 4 เมษายน ช่วยให้ LLM ผลิตผลลัพธ์ที่ดีขึ้นและรวดเร็วขึ้นสำหรับแบบสอบถามทั่วไป

เทคนิคนี้เป็นการผสมผสานระหว่างสองวิธี DeepSeek ที่ประสบความสำเร็จมาแล้ว วิธีหนึ่งคือการสร้างแบบจำลองรางวัลเชิงสร้างสรรค์ (GRM) ซึ่งช่วยให้โมเดล AI สามารถประเมินตัวเองและปรับแต่งคำตอบตามผลลัพธ์ก่อนหน้าได้ และอีกวิธีหนึ่งคือการปรับแต่งการวิจารณ์ตามหลักการของตนเอง

ทั้งสองวิธีนี้จะอาศัยองค์ประกอบ "การเรียนรู้ด้วยตนเอง" ของ AI ซึ่งลดการพึ่งพาการตอบรับหรือคำแนะนำโดยตรงจากมนุษย์ แต่ก็มีความต้องการที่จะให้ผลลัพธ์ที่ใกล้เคียงกับความคาดหวังของมนุษย์มากขึ้น

ตามที่นักวิจัยได้กล่าวไว้ แม้ว่า DeepSeek-GRM จะเป็นวิธีใหม่ แต่ก็ยังคงให้ประสิทธิภาพที่โดดเด่นและสามารถแข่งขันกับโมเดล AI ที่มีชื่อเสียงและมีประสิทธิผลสูงสุดในปัจจุบันได้ DeepSeek มีแผนที่จะโอเพ่นซอร์สโมเดล GRM แต่ยังไม่ได้ระบุระยะเวลาที่แน่ชัด

หลังจากสร้างกระแสไปทั่วโลกด้วยโมเดลแพลตฟอร์ม V3 และโมเดลอนุมาน R1 แล้ว DeepSeek ก็ได้เผยแพร่บทความวิชาการนี้บนคลัง ข้อมูลวิทยาศาสตร์ ออนไลน์ที่ชื่อว่า arXiv ทำให้หลายๆ คนเกิดความอยากรู้เกี่ยวกับการดำเนินการครั้งต่อไปของบริษัท

สำนักข่าวรอยเตอร์ คาดการณ์ว่า DeepSeek-R2 ซึ่งเป็นรุ่นต่อจาก R1 อาจเปิดตัวได้ในเดือนเมษายน เนื่องจากรุ่นก่อนหน้ายังไม่ร้อนเท่าไหร่นัก ก่อนหน้านี้ DeepSeek-R1 ได้สร้างความตกตะลึงให้กับโลกเทคโนโลยีระดับโลก ด้วยประสิทธิภาพที่โดดเด่นเมื่อเทียบกับต้นทุน ซึ่งถือว่าสามารถแข่งขันกับรุ่นชั้นนำในปัจจุบันได้

DeepSeek ยังคงนิ่งเงียบต่อการคาดเดาดังกล่าว อย่างไรก็ตาม ตามข้อมูลในท้องถิ่น บัญชีฝ่ายดูแลลูกค้าของ DeepSeek ปฏิเสธข้อมูลข้างต้นในกลุ่มสนทนากับลูกค้าองค์กร

DeepSeek ก่อตั้งขึ้นที่เมืองหางโจวในปี 2023 โดยผู้ประกอบการ Liang Wenfeng และได้รับความสนใจจากทั่วโลกอย่างรวดเร็วในช่วงไม่กี่เดือนที่ผ่านมา แต่แทนที่จะแสวงหารายได้จากชื่อเสียงสาธารณะ บริษัทกลับเน้นทรัพยากรไปที่การวิจัยและพัฒนา

ก่อนหน้านี้ DeepSeek ได้อัปเกรดโมเดล V3 โดยเปิดตัวเวอร์ชัน DeepSeek-V3-0324 ตามการประกาศ การอัปเดตนี้จะมีคุณสมบัติการอนุมานที่ได้รับการปรับปรุง เพิ่มประสิทธิภาพสำหรับการพัฒนาเว็บส่วนหน้า และปรับปรุงการเขียนภาษาจีน

ในเดือนกุมภาพันธ์ บริษัทสตาร์ทอัพแห่งนี้ยังได้เปิดซอร์สคลังเก็บโค้ดจำนวนห้าแห่ง ซึ่งเป็นการยืนยันถึงความมุ่งมั่นที่จะ "ดำเนินไปข้างหน้าด้วยความโปร่งใสอย่างเต็มที่" นอกจากนี้ ในเดือนนี้ บริษัทได้เผยแพร่เอกสารทางเทคนิคเรื่อง “การใส่ใจแบบเบาบางแบบดั้งเดิม” ซึ่งช่วยปรับปรุงประสิทธิภาพของ LLM ในการประมวลผลข้อมูลจำนวนมหาศาล

DeepSeek ถูกมองว่าเป็นสัญลักษณ์แห่งความยืดหยุ่นของอุตสาหกรรม AI ของจีน ท่ามกลางความพยายามของสหรัฐฯ ที่จะยับยั้งการพัฒนาด้านเทคโนโลยีของประเทศ

ที่มา: https://znews.vn/deepseek-gay-to-mo-post1543900.html


การแสดงความคิดเห็น (0)

No data
No data

หมวดหมู่เดียวกัน

สำรวจป่าดึกดำบรรพ์ฟูก๊วก
ชมอ่าวฮาลองจากมุมสูง
เพลิดเพลินกับดอกไม้ไฟสุดอลังการในคืนเปิดเทศกาลดอกไม้ไฟนานาชาติดานังปี 2025
เทศกาลดอกไม้ไฟนานาชาติดานัง 2025 (DIFF 2025) ถือเป็นเทศกาลที่ยาวนานที่สุดในประวัติศาสตร์

ผู้เขียนเดียวกัน

มรดก

รูป

ธุรกิจ

No videos available

ข่าว

ระบบการเมือง

ท้องถิ่น

ผลิตภัณฑ์