DeepSeek พัฒนาโมเดลที่สามารถตรวจสอบการอนุมานทางคณิตศาสตร์ด้วยตนเองได้

การเปิดตัวโมเดล DeepSeekMath-V2 ของ DeepSeek ถือเป็นเหตุการณ์สำคัญ ไม่ใช่แค่เพียงการสร้าง AI คณิตศาสตร์ที่ดีขึ้นเท่านั้น

Báo Tuổi Trẻ•01/12/2025

DeepSeek - Ảnh 1. — DeepSeak ได้พัฒนาโมเดล AI ที่ไม่เพียงแค่เขียนโค้ด แต่ยังตรวจสอบและพิสูจน์ว่าถูกต้องอีกด้วย

DeepSeekMath-V2 ได้สร้างสถิติประสิทธิภาพการทำงานที่ไม่เคยมีมาก่อน แซงหน้าความสำเร็จของมนุษย์ในการแข่งขันวิชาการอันเข้มข้น ที่น่าสังเกตคือโมเดลนี้ได้รับรางวัลเหรียญทองในการแข่งขันคณิตศาสตร์โอลิมปิกระหว่างประเทศ (IMO) ปี 2025 และสร้างความประหลาดใจด้วยคะแนน 118/120 ในการสอบ Putnam ซึ่งสูงกว่าสถิติคะแนนสูงสุด 90 คะแนนที่มนุษย์เคยทำได้

แต่สิ่งที่ทำให้โมเดลนี้ก้าวล้ำจริงๆ ไม่ใช่คะแนน แต่เป็นคุณสมบัติ "การยืนยันตนเอง" ของ DeepSeek

กลไกการตรวจสอบตนเองและการแก้ไขข้อผิดพลาดของ DeepSeek

เป็นเวลาหลายปีแล้วที่โมเดลปัญญาประดิษฐ์ (AI) และโมเดลภาษาขนาดใหญ่ (LLM) เผชิญกับจุดอ่อนที่ร้ายแรงในการแก้ปัญหาที่ต้องใช้ตรรกะเชิงตรรกะอย่างแท้จริง เช่น คณิตศาสตร์ ซึ่งเป็นปรากฏการณ์ของ "การใช้เหตุผลที่ผิดแต่ได้คำตอบที่ถูกต้อง"

นั่นคือ โมเดลอาจสร้างคำตอบสุดท้ายที่ถูกต้องขึ้นมาแบบสุ่ม แต่ลำดับขั้นตอนการอนุมาน สูตร หรือขั้นตอนตรรกะที่นำไปสู่ผลลัพธ์นั้นอาจไม่ถูกต้อง ไม่สมบูรณ์ หรือเป็นภาพหลอนก็ได้

ในสาขา วิทยาศาสตร์ วิศวกรรมศาสตร์ และคณิตศาสตร์ คำตอบที่ถูกต้องแต่ผลลัพธ์ที่ผิดนั้นไร้ค่าโดยสิ้นเชิง และยังลดความน่าเชื่อถือของระบบ AI ลงอย่างมาก DeepSeekMath-V2 ถูกสร้างขึ้นเพื่อยุติยุคแห่งความไม่น่าเชื่อถือนี้

ความสามารถในการตรวจสอบตนเองของ DeepSeekMath-V2 คือหัวใจสำคัญของความสำเร็จ DeepSeekMath-V2 ทำหน้าที่เป็น "ผู้ตรวจสอบภายใน" ในกระบวนการคิดของ AI แทนที่จะสรุปผลเพียงครั้งเดียวแล้วแสดงผลลัพธ์ออกมา โมเดล DeepSeekMath-V2 ได้ผสานรวมกลไกแบบสองทางเข้าด้วยกัน

บทบาทแรกคือบทบาทการพิสูจน์ ซึ่งโมเดลจะสร้างชุดอาร์กิวเมนต์และวิธีแก้ปัญหาเบื้องต้น จากนั้นโมเดลจะเรียกใช้ระบบตรวจสอบภายในโดยอัตโนมัติ ซึ่งจะตรวจสอบแต่ละขั้นตอนเชิงตรรกะของชุดอาร์กิวเมนต์ที่เพิ่งสร้างขึ้น เพื่อค้นหาข้อผิดพลาด ความไม่สอดคล้อง หรือขั้นตอนที่ไม่เหมาะสม

กระบวนการนี้คล้ายคลึงกับระบบประเมินผล IMO-ProofBench มาก โดย AI หนึ่งตัวจะสร้างอาร์กิวเมนต์ขึ้นมา และอีกตัวหนึ่งจะตรวจสอบอาร์กิวเมนต์นั้น ด้วยการตรวจสอบซ้ำนี้จนกระทั่งอาร์กิวเมนต์ทั้งหมดได้รับการยืนยันว่าถูกต้องสมบูรณ์ DeepSeekMath-V2 จึงมั่นใจได้ว่าคำตอบนั้นไม่เพียงถูกต้องเท่านั้น แต่เส้นทางไปสู่คำตอบนั้นยังถูกต้องและโปร่งใสอย่างแน่นอนอีกด้วย

ปลดล็อกอนาคตของ AI ที่เชื่อถือได้

ผลที่ตามมาของวิธีการอนุมานตรวจสอบตนเองนี้อาจกำหนดมาตรฐานใหม่ของความโปร่งใสและความน่าเชื่อถือสำหรับการใช้งาน AI ในโลกแห่ง ความเป็นจริง

ในอนาคตโมเดลนี้สามารถนำไปประยุกต์ใช้ในด้านสำคัญอื่นๆ ได้ เช่น AI ไม่เพียงแต่เขียนโค้ดเท่านั้น แต่ยังตรวจสอบตัวเองและพิสูจน์ความถูกต้องได้อีกด้วย ซึ่งจะลดข้อผิดพลาดที่ร้ายแรงให้เหลือน้อยที่สุด

นอกจากนี้ AI ยังสามารถตรวจสอบลำดับเหตุผลที่ซับซ้อนได้โดยอัตโนมัติเมื่อพัฒนาสมมติฐานหรือพิสูจน์ทฤษฎีบทใหม่ๆ จึงรับประกันความสมเหตุสมผลและความปลอดภัยของการตัดสินใจที่สำคัญที่ทำโดย AI

การตัดสินใจของ DeepSeek ที่จะเปิดเผยโค้ดต้นฉบับของโมเดลต่อสาธารณะบนแพลตฟอร์มเช่น Hugging Face และ GitHub ถือเป็นการเคลื่อนไหวเชิงกลยุทธ์ที่อนุญาตให้ชุมชนนักวิจัยทั่วโลกเข้าถึงและสร้างหลักการอนุมานที่ตรวจสอบได้นี้

DeepSeekMath-V2 แสดงให้เห็นถึงก้าวกระโดดทางควอนตัมที่ไม่เพียงแต่แสดงให้เห็นถึงความสามารถอันเหนือชั้นของ AI ในการแก้ปัญหาที่ยากที่สุดเท่านั้น แต่ยังรับประกันว่าความสามารถนี้สร้างขึ้นบนรากฐานของความไว้วางใจและตรรกะที่แน่วแน่ นี่เป็นข้อพิสูจน์ว่า AI รุ่นต่อไปจะไม่เพียงแต่ฉลาดขึ้นเท่านั้น แต่ยังซื่อสัตย์และโปร่งใสมากขึ้นในกระบวนการคิดอีกด้วย

กลับสู่หัวข้อ

ทะเลตะวันออก

ที่มา: https://tuoitre.vn/deepseek-phat-trien-mo-hinh-co-kha-nang-tu-kiem-chung-cac-suy-luan-trong-toan-hoc-2025113016585069.htm