
DeepSeak ໄດ້ພັດທະນາຕົວແບບ AI ທີ່ບໍ່ພຽງແຕ່ຂຽນລະຫັດເທົ່ານັ້ນແຕ່ຍັງກວດສອບແລະພິສູດຕົວເອງວ່າຖືກຕ້ອງ.
DeepSeekMath-V2 ໄດ້ກໍານົດບັນທຶກການປະຕິບັດທີ່ບໍ່ເຄີຍມີມາກ່ອນ, ເກີນຜົນສໍາເລັດຂອງມະນຸດໃນການແຂ່ງຂັນທາງວິຊາການທີ່ເຄັ່ງຄັດ. ເປັນໜ້າສັງເກດ, ຕົວແບບໄດ້ຮັບຫລຽນຄຳໃນງານກິລາໂອລິມປິກຄະນິດສາດສາກົນປີ 2025 (IMO) ແລະ ເຮັດໃຫ້ຕົກໃຈດ້ວຍຄະແນນ 118/120 ໃນການສອບເສັງ Putnam, ລື່ນກາຍສະຖິຕິຂອງ 90 ຄະແນນສູງສຸດທີ່ມະນຸດບັນລຸໄດ້.
ແຕ່ສິ່ງທີ່ເຮັດໃຫ້ຕົວແບບນີ້ມີຄວາມໂດດເດັ່ນຢ່າງແທ້ຈິງບໍ່ແມ່ນຄະແນນ, ແຕ່ຄຸນສົມບັດ "ການກວດສອບຕົນເອງ" ຂອງ DeepSeek.
ກົນໄກການກວດສອບຕົນເອງ ແລະການແກ້ໄຂຄວາມຜິດພາດຂອງ DeepSeek
ເປັນເວລາຫຼາຍປີ, ຮູບແບບປັນຍາປະດິດ (AI) ແລະຕົວແບບພາສາຂະຫນາດໃຫຍ່ (LLMs) ໄດ້ປະເຊີນກັບຄວາມອ່ອນແອທີ່ຮ້າຍແຮງໃນເວລາທີ່ການແກ້ໄຂບັນຫາທີ່ຕ້ອງການເຫດຜົນຢ່າງແທ້ຈິງເຊັ່ນຄະນິດສາດ, ເຊິ່ງເປັນປະກົດການຂອງ "ເຫດຜົນຜິດແຕ່ຄໍາຕອບທີ່ຖືກຕ້ອງ".
ນັ້ນແມ່ນ, ຮູບແບບອາດຈະ Random ຜະລິດຄໍາຕອບສຸດທ້າຍທີ່ຖືກຕ້ອງ, ແຕ່ລໍາດັບຂອງຂັ້ນຕອນ inference, ສູດ, ຫຼືຂັ້ນຕອນທີ່ມີເຫດຜົນທີ່ນໍາໄປສູ່ຜົນໄດ້ຮັບນັ້ນອາດຈະບໍ່ຖືກຕ້ອງ, ບໍ່ຄົບຖ້ວນ, ຫຼື hallucinate.
ໃນຂົງເຂດ ວິທະຍາສາດ , ວິສະວະກໍາແລະຄະນິດສາດ, ຄໍາຕອບທີ່ຖືກຕ້ອງທີ່ມີການແກ້ໄຂຜິດພາດບໍ່ມີຄຸນຄ່າຢ່າງແທ້ຈິງແລະຫຼຸດຜ່ອນຄວາມຫນ້າເຊື່ອຖືຂອງລະບົບ AI ໄດ້ຢ່າງຫຼວງຫຼາຍ. DeepSeekMath-V2 ຖືກສ້າງຂື້ນເພື່ອຢຸດຍຸກຂອງຄວາມບໍ່ຫນ້າເຊື່ອຖືນີ້.
ຄວາມສາມາດໃນການກວດສອບຕົນເອງຂອງ DeepSeekMath-V2 ແມ່ນຢູ່ໃນຫຼັກຂອງຄວາມສໍາເລັດຂອງມັນ. ມັນເຮັດຫນ້າທີ່ເປັນ "ຜູ້ກວດສອບພາຍໃນ" ໃນຂະບວນການຄິດຂອງ AI. ແທນທີ່ຈະພຽງແຕ່ເຮັດໃຫ້ການສົມມຸດຕິຖານອັນດຽວແລະຜົນໄດ້ຮັບຄໍາຕອບ, ຮູບແບບ DeepSeekMath-V2 ປະກອບມີກົນໄກສອງທາງ.
ທໍາອິດແມ່ນບົດບາດການພິສູດ, ບ່ອນທີ່ຕົວແບບສ້າງລະບົບຕ່ອງໂສ້ການໂຕ້ຖຽງແລະການແກ້ໄຂເບື້ອງຕົ້ນ. ຮູບແບບຫຼັງຈາກນັ້ນຈະກະຕຸ້ນລະບົບການກວດສອບພາຍໃນໂດຍອັດຕະໂນມັດ, ເຊິ່ງທົບທວນແຕ່ລະຂັ້ນຕອນຢ່າງມີເຫດຜົນຂອງລະບົບຕ່ອງໂສ້ການໂຕ້ຖຽງທີ່ພຽງແຕ່ສ້າງຂຶ້ນ, ຊອກຫາຂໍ້ຜິດພາດ, ຄວາມບໍ່ສອດຄ່ອງ, ຫຼືການກ້າວກະໂດດທີ່ບໍ່ສົມເຫດສົມຜົນ.
ຂະບວນການນີ້ແມ່ນຄ້າຍຄືກັນກັບລະບົບການປະເມີນຜົນ IMO-ProofBench ເຮັດວຽກ, ບ່ອນທີ່ AI ສ້າງການໂຕ້ຖຽງແລະ AI ອື່ນກວດສອບມັນ. ໂດຍການເຮັດຊ້ໍາການກວດສອບຂ້າມນີ້ຈົນກ່ວາລະບົບຕ່ອງໂສ້ຂອງການໂຕ້ຖຽງໄດ້ຮັບການຢືນຢັນວ່າແຂງຢ່າງແທ້ຈິງ, DeepSeekMath-V2 ຮັບປະກັນວ່າບໍ່ພຽງແຕ່ຄໍາຕອບທີ່ຖືກຕ້ອງ, ແຕ່ເສັ້ນທາງໄປສູ່ຄໍາຕອບນັ້ນແມ່ນຖືກຕ້ອງແລະໂປ່ງໃສຢ່າງແທ້ຈິງ.
ປົດລັອກອະນາຄົດຂອງ AI ທີ່ເຊື່ອຖືໄດ້
ຜົນສະທ້ອນຂອງວິທີການ inference ຢືນຢັນຕົນເອງນີ້ສາມາດກໍານົດມາດຕະຖານໃຫມ່ຂອງຄວາມໂປ່ງໃສແລະຄວາມຫນ້າເຊື່ອຖືສໍາລັບຄໍາຮ້ອງສະຫມັກ AI ໃນໂລກ ທີ່ແທ້ຈິງ.
ໃນອະນາຄົດ, ຮູບແບບນີ້ສາມາດຖືກນໍາໃຊ້ໃນຂົງເຂດທີ່ສໍາຄັນອື່ນໆເຊັ່ນ: AI ບໍ່ພຽງແຕ່ຂຽນລະຫັດເທົ່ານັ້ນ, ແຕ່ຍັງກວດສອບຕົນເອງແລະພິສູດຄວາມຖືກຕ້ອງ, ຫຼຸດຜ່ອນຄວາມຜິດພາດທີ່ຮ້າຍແຮງ.
ນອກຈາກນັ້ນ, AI ສາມາດກວດສອບລະບົບຕ່ອງໂສ້ການສົມເຫດສົມຜົນທີ່ສັບສົນໂດຍອັດຕະໂນມັດໃນເວລາທີ່ການພັດທະນາສົມມຸດຕິຖານຫຼືການພິສູດທິດສະດີໃຫມ່, ດັ່ງນັ້ນການຮັບປະກັນຄວາມສົມເຫດສົມຜົນແລະຄວາມປອດໄພຂອງການຕັດສິນໃຈທີ່ສໍາຄັນທີ່ເຮັດໂດຍ AI.
ການຕັດສິນໃຈຂອງ DeepSeek ທີ່ຈະເປີດເຜີຍລະຫັດແຫຼ່ງຂອງຕົວແບບໃນເວທີເຊັ່ນ: Hugging Face ແລະ GitHub ແມ່ນການເຄື່ອນໄຫວຍຸດທະສາດ, ອະນຸຍາດໃຫ້ຊຸມຊົນຄົ້ນຄ້ວາທົ່ວໂລກເຂົ້າເຖິງແລະສ້າງຫຼັກການ inference ທີ່ສາມາດຢືນຢັນໄດ້.
DeepSeekMath-V2 ສະແດງໃຫ້ເຫັນເຖິງການກ້າວກະໂດດຂອງ quantum, ບໍ່ພຽງແຕ່ສະແດງໃຫ້ເຫັນຄວາມສາມາດທີ່ດີກວ່າຂອງ AI ໃນການແກ້ໄຂບັນຫາທີ່ຍາກທີ່ສຸດ, ແຕ່ຍັງຮັບປະກັນວ່າຄວາມສາມາດນີ້ຖືກສ້າງຂຶ້ນບົນພື້ນຖານຂອງຄວາມໄວ້ວາງໃຈແລະເຫດຜົນທີ່ບໍ່ສັ່ນສະເທືອນ. ນີ້ແມ່ນຫຼັກຖານສະແດງວ່າ AI ຮຸ່ນຕໍ່ໄປບໍ່ພຽງແຕ່ຈະສະຫລາດກວ່າ, ແຕ່ຍັງມີຄວາມຊື່ສັດແລະໂປ່ງໃສໃນຂະບວນການຄິດຂອງມັນ.
ທີ່ມາ: https://tuoitre.vn/deepseek-phat-trien-mo-hinh-co-kha-nang-tu-kiem-chung-cac-suy-luan-trong-toan-hoc-2025113016585069.htm






(0)