Vietnam.vn - Nền tảng quảng bá Việt Nam

การประชุมพิเศษที่นักคณิตศาสตร์พยายามเอาชนะปัญญาประดิษฐ์

นักคณิตศาสตร์ชั้นนำของโลกประชุมกันเป็นการลับเพื่อหาทางเอาชนะปัญญาประดิษฐ์ (AI) แต่กลับประหลาดใจกับความสามารถของ AI

VietnamPlusVietnamPlus20/05/2025

สุดสัปดาห์หนึ่งในช่วงกลางเดือนพฤษภาคม ได้มีการประชุมลับของวงการคณิตศาสตร์ขึ้น นักคณิตศาสตร์ชั้นนำ ของโลก 30 คน ได้เดินทางไปยังเมืองเบิร์กลีย์ รัฐแคลิฟอร์เนีย สหรัฐอเมริกา อย่างลับๆ เพื่อเข้าร่วมการแข่งขันกับแชทบอทที่สามารถ "ใช้เหตุผล" ได้ แชทบอทนี้ได้รับมอบหมายให้แก้ปัญหาที่นักคณิตศาสตร์เขียนขึ้นเอง เพื่อทดสอบความสามารถในการแก้ปัญหาของมัน

หลังจากที่ยิงคำถามระดับศาสตราจารย์อย่างต่อเนื่องเป็นเวลาสองวัน นักคณิตศาสตร์ก็ต้องประหลาดใจเมื่อตระหนักว่าแชทบอทนี้สามารถแก้ปัญหาที่ยากที่สุดบางส่วนที่เคยแก้ได้ในประวัติศาสตร์ได้

“ผมเห็นเพื่อนร่วมงานพูดตรงๆ ว่าโมเดลภาษาขนาดใหญ่นี้กำลังเข้าใกล้ระดับอัจฉริยะทางคณิตศาสตร์แล้ว” Ken Ono ศาสตราจารย์จากมหาวิทยาลัยเวอร์จิเนียและประธานและกรรมการการประชุมกล่าวกับ Scientific American

แชทบอทที่ดึงดูดความสนใจของเราขับเคลื่อนโดย o4-mini ซึ่งเป็นโมเดลภาษาขนาดใหญ่ (LLM) ที่ออกแบบมาสำหรับการใช้เหตุผลเชิงซ้อน มันเป็นผลิตภัณฑ์ของ OpenAI และได้รับการฝึกฝนให้สามารถใช้เหตุผลเชิงซ้อนได้ โมเดลที่เทียบเท่าจาก Google คือ Gemini 2.5 Flash ก็มีความสามารถใกล้เคียงกัน

เช่นเดียวกับ ChatGPT LLM รุ่นก่อนหน้า o4-mini เรียนรู้การทำนายคำถัดไปในสตริงข้อความ อย่างไรก็ตาม o4-mini เป็นเวอร์ชันที่เบากว่าและยืดหยุ่นกว่า ฝึกฝนด้วยข้อมูลเชิงลึกและปรับแต่งโดยมนุษย์อย่างใกล้ชิด ช่วยให้สามารถเจาะลึกปัญหาทางคณิตศาสตร์ที่แบบจำลองรุ่นก่อนๆ ทำไม่ได้

เพื่อทดสอบความสามารถของ o4-mini OpenAI ได้ขอให้ Epoch AI ซึ่งเป็นองค์กรไม่แสวงหาผลกำไรที่เชี่ยวชาญด้านการทดสอบแบบจำลอง LLM สร้างคำถามคณิตศาสตร์ที่ไม่เคยเผยแพร่มาก่อนจำนวน 300 ข้อ แม้ว่าหลักสูตร LLM แบบดั้งเดิมจะสามารถแก้ปัญหาที่ซับซ้อนได้มากมาย แต่เมื่อถูกท้าทายด้วยคำถามใหม่ทั้งหมด พบว่าส่วนใหญ่ตอบถูกน้อยกว่า 2% ซึ่งบ่งชี้ว่าหลักสูตรเหล่านี้ไม่มีความสามารถในการใช้เหตุผลอย่างแท้จริง

ในโครงการประเมินผลใหม่นี้ Epoch AI ได้คัดเลือกนักคณิตศาสตร์รุ่นเยาว์ ดร. เอลเลียต เกลเซอร์ มาเป็นหัวหน้าโครงการ โครงการใหม่นี้มีชื่อว่า FrontierMath และจะเริ่มดำเนินการตั้งแต่เดือนกันยายน 2567

โครงการนี้รวบรวมคำถามใหม่ ๆ ไว้ 4 ระดับความยาก ตั้งแต่ระดับปริญญาตรี ปริญญาโท ไปจนถึงระดับการวิจัยขั้นสูง ภายในเดือนเมษายน ปี 2025 เกลเซอร์พบว่า o4-mini สามารถแก้ปัญหาได้ประมาณ 20% ดังนั้นเขาจึงยกระดับขึ้นเป็นระดับ 4 โดยขอให้มันแก้ปัญหาที่แม้แต่นักคณิตศาสตร์ขั้นสูงก็ยังทำได้ยาก

ผู้เข้าร่วมถูกบังคับให้ลงนามในข้อตกลงการรักษาความลับ และสามารถสื่อสารได้เฉพาะผ่านแอปเข้ารหัส Signal เท่านั้น เนื่องจากการใช้อีเมลอาจทำให้ LLM สามารถสแกนและ "ดมกลิ่น" เนื้อหาได้ จึงทำให้ข้อมูลการประเมินเป็นเท็จ

แต่ละปัญหาที่ o4-mini ไม่สามารถแก้ไขได้ จะได้รับรางวัลมูลค่า 7,500 เหรียญสหรัฐ

ทีมชุดแรกมีความคืบหน้าอย่างช้าๆ แต่มั่นคงในการคิดคำถาม แต่เกลเซอร์ตัดสินใจเร่งกระบวนการด้วยการจัดการประชุมแบบตัวต่อตัวในวันที่ 17-18 พฤษภาคม นักคณิตศาสตร์ที่เข้าร่วม 30 คนถูกแบ่งออกเป็นกลุ่มละ 6 คน แข่งขันกัน ไม่ใช่เพื่อแก้ปัญหา แต่เพื่อคิดหาปัญหาที่ปัญญาประดิษฐ์ (AI) แก้ไม่ได้

พอถึงเย็นวันที่ 17 พฤษภาคม เคน โอโนะก็เริ่มรู้สึกหงุดหงิดกับแชทบอท ซึ่งแสดงให้เห็นถึงความสามารถทางคณิตศาสตร์ที่เกินความคาดหมาย ทำให้ทีมยากที่จะ “ดักจับ” มัน “ผมคิดโจทย์ปัญหาหนึ่งขึ้นมาได้ ซึ่งผู้เชี่ยวชาญในสาขานี้จะมองว่าเป็นปัญหาเปิดในทฤษฎีจำนวน ซึ่งเป็นโจทย์ที่เหมาะสำหรับผู้ที่จบปริญญาเอก” เขากล่าว

ผลก็คือ เมื่อเขาถาม o4-mini เขาถึงกับตะลึงเมื่อเห็นแชทบอทวิเคราะห์ หาเหตุผล และหาคำตอบที่ถูกต้องได้ภายในเวลาเพียง 10 นาที โดยเฉพาะอย่างยิ่งในสองนาทีแรก มันเรียนรู้และเข้าใจเอกสารที่เกี่ยวข้องทั้งหมด จากนั้นจึงเสนอให้ลองแก้ปัญหาในเวอร์ชันที่ง่ายกว่าเพื่อเรียนรู้วิธีการแก้ปัญหา

ห้านาทีต่อมา แชทบอทก็ตอบถูก พูดด้วยน้ำเสียงมั่นใจ แม้กระทั่งหยิ่งยโส “มันเริ่มทะลึ่งแล้ว” โอโนะกล่าว “แล้วมันก็เสริมว่า ‘ไม่ต้องใส่เครื่องหมายคำพูดหรอก เพราะผมรู้เลขลับแล้ว!’”

หลังจากพ่ายแพ้ต่อ AI ในเช้าตรู่ของวันที่ 18 พฤษภาคม โอโนะจึงส่งข้อความเตือนไปยังทีมทันทีผ่าน Signal “ผมไม่ได้เตรียมตัวมาเลยที่จะรับมือกับโมเดลแบบนี้” เขากล่าว “ผมไม่เคยเห็นการใช้เหตุผลแบบนี้ในโมเดลคอมพิวเตอร์มาก่อน มันเหมือนกับการคิดแบบที่ นักวิทยาศาสตร์ จริงๆ คิด และนั่นมันน่ากลัวมาก”

แม้ว่านักคณิตศาสตร์จะสามารถค้นพบคำถาม 10 ข้อที่ทำให้ o4-mini งงได้ในที่สุด แต่พวกเขาก็ยังไม่สามารถซ่อนความตกตะลึงกับความเร็วในการพัฒนาของ AI ในเวลาเพียงหนึ่งปีได้

โอโนะเปรียบเทียบประสบการณ์การทำงานกับ o4-mini กับการทำงานร่วมกันกับเพื่อนร่วมงานผู้มีความสามารถสูง ส่วนหยาง ฮุย เหอ นักคณิตศาสตร์ประจำสถาบันวิทยาศาสตร์คณิตศาสตร์แห่งลอนดอน และผู้บุกเบิกการประยุกต์ใช้ AI กับคณิตศาสตร์ ให้ความเห็นว่า “นี่คือสิ่งที่นักศึกษาปริญญาเอกผู้มีความสามารถสูงสามารถทำได้ และทำได้มากกว่านั้นอีก”

และควรสังเกตว่า AI ทำได้เร็วกว่ามนุษย์มาก แม้ว่ามนุษย์จะใช้เวลาหลายสัปดาห์หรือหลายเดือนในการแก้ปัญหา แต่ o4-mini ใช้เวลาเพียงไม่กี่นาทีเท่านั้น

ความตื่นเต้นที่รายล้อม o4-mini นั้นไม่ใช่เรื่องไร้กังวล ทั้งโอโนะและเฮเตือนว่าความสามารถของ o4-mini อาจทำให้ผู้คนมั่นใจมากเกินไป “เรามีหลักฐานโดยการอุปนัย หลักฐานโดยการขัดแย้ง และตอนนี้หลักฐานโดยการ… ท่วมท้น” เขากล่าว “ถ้าคุณพูดอะไรด้วยความมั่นใจมากพอ ผู้คนจะรู้สึกหวาดกลัว ผมคิดว่า o4-mini ได้เชี่ยวชาญการพิสูจน์แบบนี้แล้ว มันพูดทุกอย่างด้วยความมั่นใจอย่างยิ่ง”

เมื่อการประชุมสิ้นสุดลง นักคณิตศาสตร์ก็เริ่มครุ่นคิดถึงอนาคตของคณิตศาสตร์ พวกเขาหารือถึงความเป็นไปได้ของ “ระดับที่ห้า” ซึ่งเป็นคำถามที่แม้แต่นักคณิตศาสตร์ที่เก่งที่สุดในโลกก็ยังแก้ไม่ได้ หากปัญญาประดิษฐ์ (AI) บรรลุถึงระดับนั้น บทบาทของนักคณิตศาสตร์จะเปลี่ยนไปอย่างมาก บางทีพวกเขาอาจกลายเป็นผู้ตั้งคำถาม โต้ตอบและชี้นำการใช้เหตุผลของปัญญาประดิษฐ์เพื่อ ค้นพบ ความจริงทางคณิตศาสตร์ใหม่ๆ คล้ายกับวิธีที่อาจารย์ทำงานกับนักศึกษาระดับบัณฑิตศึกษา

“ผมบอกเพื่อนร่วมงานมานานแล้วว่า การคิดว่าปัญญาประดิษฐ์ทั่วไปจะไม่มีวันเกิดขึ้นได้ เป็นเพียงคอมพิวเตอร์ คงเป็นความผิดพลาดอย่างใหญ่หลวง” โอโนะกล่าว “ผมไม่อยากตื่นตระหนก แต่ในบางแง่มุม โมเดลภาษาขนาดใหญ่เหล่านี้ก็เริ่มแซงหน้านักศึกษาปริญญาเอกที่เก่งที่สุดในโลกไปแล้ว”

(เวียดนาม+)

ที่มา: https://www.vietnamplus.vn/cuoc-gap-go-dac-biet-noi-cac-nha-toan-hoc-tim-cach-danh-bai-tri-tue-nhan-tao-post1043183.vnp


การแสดงความคิดเห็น (0)

No data
No data

หมวดหมู่เดียวกัน

มีเนินดอกซิมสีม่วงอยู่บนฟ้าของซอนลา
โคมไฟ - ของขวัญแห่งความทรงจำในเทศกาลไหว้พระจันทร์
โต เฮ – จากของขวัญในวัยเด็กสู่ผลงานศิลปะมูลค่าล้านเหรียญ
ความพยายามในการอนุรักษ์หัตถกรรมดั้งเดิมของการทำของเล่นไหว้พระจันทร์ในหมู่บ้านอองห่าว

ผู้เขียนเดียวกัน

มรดก

รูป

ธุรกิจ

No videos available

เหตุการณ์ปัจจุบัน

ระบบการเมือง

ท้องถิ่น

ผลิตภัณฑ์