
ຜູ້ຂຽນຜົນງານທີ່ຕີພິມໃນລະດັບສາກົນໃນວາລະສານຄອມພິວເຕີ ແລະ ການສຶກສາ: ປັນຍາປະດິດ - ຮູບພາບ: ສະໜອງໃຫ້ໂດຍຜູ້ຂຽນ
ອີງຕາມວິທະຍານິພົນຈົບການສຶກສາຂອງນັກສຶກສາຈາກມະຫາວິທະຍາໄລເຕັກໂນໂລຢີ (ມະຫາວິທະຍາໄລແຫ່ງຊາດຫວຽດນາມ ນະຄອນໂຮ່ຈິມິນ), ການສຶກສາກ່ຽວກັບເຕັກນິກໃໝ່ເພື່ອຊ່ວຍໃຫ້ AI ຕອບຄຳຖາມແບບເລືອກຕອບໄດ້ຢ່າງສອດຄ່ອງກັນຫຼາຍຂຶ້ນໄດ້ຖືກຕີພິມໃນວາລະສານສາກົນໄຕມາດທີ 1.
ຜົນງານການຄົ້ນຄວ້າຂອງຄະນະວິຊາ ແລະ ນັກສຶກສາຂອງພະແນກວິທະຍາສາດຄອມພິວເຕີ ແລະ ວິສະວະກຳສາດຢູ່ມະຫາວິທະຍາໄລແຫ່ງນີ້ ເຊິ່ງມີຕົ້ນກຳເນີດມາຈາກວິທະຍານິພົນຈົບການສຶກສາຂອງມະຫາວິທະຍາໄລ, ໄດ້ຖືກຕີພິມໃນວາລະສານສາກົນຊັ້ນນຳກ່ຽວກັບປັນຍາປະດິດ (AI) ໃນ ການສຶກສາ ຫຼັງຈາກຜ່ານການທົບທວນຄືນຫຼາຍຮອບ.
ເປັນເວລາຫຼາຍກວ່າສອງປີໃນການພິມເຜີຍແຜ່ໃນລະດັບສາກົນ.
ເອກະສານ "ການເພີ່ມປະສິດທິພາບຂອງຮູບແບບພາສາຂະໜາດໃຫຍ່ສຳລັບການຕອບຄຳຖາມແບບເລືອກຕອບອັດຕະໂນມັດແບບ Zero-Shot ຜ່ານການກະຕຸ້ນການເຂົ້າສູ່ລະບົບໂທເຄັນດຽວ" ໂດຍກຸ່ມນັກຂຽນຈາກຫວຽດນາມໄດ້ຖືກຕີພິມໃນວາລະສານຄອມພິວເຕີ ແລະ ການສຶກສາ: ປັນຍາປະດິດ.
ນີ້ແມ່ນວາລະສານທີ່ເປີດໃຫ້ເຂົ້າເຖິງໄດ້ໂດຍ Elsevier, ປະຈຸບັນຢູ່ໃນອັນດັບທີ 1 ຂອງໄຕມາດທຳອິດ, ນຳໜ້າໃນໝວດການສຶກສາ, ອັນດັບທີ 4 ໃນການນຳໃຊ້ ວິທະຍາສາດ ຄອມພິວເຕີ, ແລະ ອັນດັບທີ 5 ໃນດ້ານປັນຍາປະດິດ (AI), ອີງຕາມ SCImago.
ທີມງານຜູ້ຂຽນປະກອບມີ Dang Phu Quoc - ອະດີດນັກສຶກສາມະຫາວິທະຍາໄລເຕັກໂນໂລຊີ (ຜູ້ຂຽນຮ່ວມ), Tran Truong Tuan Phat - ອາຈານສອນຢູ່ມະຫາວິທະຍາໄລເຕັກໂນໂລຊີ (ຜູ້ຂຽນຮ່ວມ), ດຣ. Vu Duc Ly (ອາຈານສອນຢູ່ມະຫາວິທະຍາໄລສາກົນຕາເວັນອອກ), Nguyen Song Thien Long ແລະ Vo Thi Nhu Quynh, ທັງສອງເປັນນັກສຶກສາປີທີສາມຢູ່ມະຫາວິທະຍາໄລເຕັກໂນໂລຊີ, ພາຍໃຕ້ການຊີ້ນຳຂອງ Associ. Dr. Quan Thanh Tho - ຫົວໜ້າພະແນກວິທະຍາສາດຄອມພິວເຕີ ແລະ ວິສະວະກຳ, ມະຫາວິທະຍາໄລເຕັກໂນໂລຊີ (ມະຫາວິທະຍາໄລແຫ່ງຊາດຫວຽດນາມ ນະຄອນໂຮ່ຈິມິນ).
ວຽກງານນີ້ສຸມໃສ່ການສະເໜີເຕັກນິກການກະຕຸ້ນໃໝ່ທີ່ເອີ້ນວ່າ Single-Token Logit (STL) ເພື່ອປັບປຸງຄວາມຖືກຕ້ອງ ແລະ ຄວາມໝັ້ນຄົງຂອງຮູບແບບພາສາຂະໜາດໃຫຍ່ (LLMs) ເມື່ອຕອບຄຳຖາມແບບເລືອກຕອບ (MCQs) ໂດຍອັດຕະໂນມັດ. ຜູ້ຂຽນ Dang Phu Quoc ກ່າວວ່າການຄົ້ນຄວ້າດັ່ງກ່າວມີຕົ້ນກຳເນີດມາຈາກວິທະຍານິພົນລະດັບປະລິນຍາຕີຂອງລາວ.
"ໃນເບື້ອງຕົ້ນ, ຂ້ອຍພຽງແຕ່ມີຈຸດປະສົງເພື່ອແກ້ໄຂບັນຫາວິຊາຊີບຂະໜາດໃຫຍ່ໃນການສ້າງແບບຈຳລອງພາສາ, ໂດຍບໍ່ຄາດຫວັງວ່າຈະຖືກຕີພິມໃນວາລະສານອັນດັບຕົ້ນໆ. ຫຼັງຈາກປະມານ 28 ເດືອນນັບຕັ້ງແຕ່ເລີ່ມຕົ້ນການຄົ້ນຄວ້າ, ໃນເດືອນມີນາ 2026, ຜົນງານດັ່ງກ່າວໄດ້ຖືກຕີພິມໃນວາລະສານຄອມພິວເຕີ ແລະ ການສຶກສາ: ປັນຍາປະດິດ," ກວກ ແບ່ງປັນ.
ນອກຈາກນັ້ນ, ທ່ານ Tran Truong Tuan Phat ໄດ້ກ່າວວ່າ ກຸ່ມດັ່ງກ່າວໄດ້ຜ່ານການທົບທວນຄືນແບບປິດຫຼາຍຮອບ, ສອງທາງ. ແຕ່ລະຮອບຕ້ອງການການປັບປຸງທີ່ສຳຄັນເຊັ່ນ: ການເພີ່ມການທົດລອງ, ການຊີ້ແຈງການຕີຄວາມໝາຍ, ການເສີມສ້າງທິດທາງການຄົ້ນຄວ້າ, ແລະ ການປັບໂຄງສ້າງຕົ້ນສະບັບ.
ກຸ່ມດັ່ງກ່າວໄດ້ເລືອກແພລດຟອມການພິມເຜີຍແຜ່ໂດຍອີງໃສ່ຄໍາແນະນໍາຈາກສໍານັກພິມ Elsevier. ຫຼັງຈາກໄດ້ຮັບການຍອມຮັບແລ້ວ ກຸ່ມຈຶ່ງຮູ້ວ່າມັນເປັນວາລະສານຊັ້ນນໍາ ຂອງໂລກ ໃນຂະແໜງການສຶກສາ. "ນັ້ນແມ່ນຜົນໄດ້ຮັບທີ່ພິເສດທີ່ແມ່ນແຕ່ຜູ້ຂຽນເອງກໍ່ບໍ່ໄດ້ຄາດຫວັງໄວ້," ຮອງສາດສະດາຈານ Quan Thanh Tho ກ່າວຕື່ມ.

ສະມາຊິກທີມຄົ້ນຄວ້າສາມຄົນ (ຈາກຊ້າຍ): ຫງວຽນ ຊອງ ທຽນ ລອງ, ເຈິ່ນ ເຈືອງ ຕວນ ຟາດ (ຜູ້ຂຽນຮ່ວມ) ແລະ ໂວ ທິ ຍູ ກວິ່ງ - ຮູບພາບ: ນ. ກວິ່ງ
ການເພີ່ມປະສິດທິພາບຂອງ AI ຜ່ານການປ່ຽນແປງເລັກນ້ອຍ.
ອີງຕາມການຄົ້ນຄວ້າຂອງພວກເຮົາ, ທີມງານໄດ້ພົບວ່າປະກົດການທີ່ເອີ້ນວ່າ Multiple-Choice Symbol Binding (MCSB) ຫຼຸດຜ່ອນຄວາມໜ້າເຊື່ອຖືຂອງ LLM ຢ່າງຫຼວງຫຼາຍ, ໂດຍສະເພາະເມື່ອນຳໃຊ້ກັບການໃຫ້ຄະແນນ ຫຼື ການສ້າງທະນາຄານຄຳຖາມໃນຂົງເຂດການສຶກສາ. ດັ່ງນັ້ນ, ທີມງານຈຶ່ງສະເໜີເຕັກນິກ Single-Token Logit (STL).
ແທນທີ່ຈະໃຫ້ຄຳຕອບທັງໝົດ ແລະ ຂໍໃຫ້ແບບຈຳລອງເລືອກ A - B - C - D ຕາມປົກກະຕິ, STL ແຍກຄຳຕອບແຕ່ລະອັນ ແລະ ຂໍໃຫ້ແບບຈຳລອງປະເມີນແຕ່ລະທາງເລືອກວ່າເປັນຖືກ ຫຼື ຜິດ.
ລະບົບຈະຖາມຕາມລຳດັບວ່າ "ຄຳຕອບນີ້ຖືກຕ້ອງບໍ?" ແລະ ໃຊ້ຄວາມເປັນໄປໄດ້ຂອງໂທເຄັນ "ແມ່ນແລ້ວ" ເພື່ອປະເມີນລະດັບຄວາມເໝາະສົມ. "ກົນໄກນີ້ຊ່ວຍໃຫ້ແບບຈຳລອງກວດສອບແຕ່ລະທາງເລືອກໄດ້ຢ່າງເປັນອິດສະຫຼະ, ໂດຍບໍ່ໄດ້ຮັບອິດທິພົນຈາກຕຳແໜ່ງ ຫຼື ປ້າຍຄຳຕອບ, ໂດຍການເອົາຊະນະຂໍ້ຈຳກັດຂອງຂໍ້ຈຳກັດ MCSB ໂດຍກົງ," Phát ເວົ້າກ່ຽວກັບຂໍ້ດີຂອງການຄົ້ນຄວ້າ.
ການສຶກສາຍັງລວມເອົາເຕັກນິກການສ້າງແບບເພີ່ມເຕີມ (RAG), ຊ່ວຍໃຫ້ແບບຈຳລອງສາມາດເຂົ້າເຖິງຄວາມຮູ້ພາຍນອກໄດ້ເມື່ອຕ້ອງການ, ປັບປຸງຄວາມຖືກຕ້ອງຂອງສະພາບການ ແລະ ທົດສອບຄວາມໝັ້ນຄົງຂອງວິທີແກ້ໄຂພາຍໃຕ້ເງື່ອນໄຂທີ່ແຕກຕ່າງກັນ.
ເມື່ອທົດສອບໃນຊຸດຂໍ້ມູນວິທະຍາສາດມາດຕະຖານສາມຊຸດຄື ARC, OpenBookQA, ແລະ SciQ—STL ໃຫ້ຜົນໄດ້ຮັບທີ່ເທົ່າກັບ ຫຼື ດີກວ່າວິທີການທີ່ນິຍົມຫຼາຍວິທີ, ໂດຍມີການປັບປຸງສູງເຖິງ 11 ຈຸດເປີເຊັນໃນບາງການຕັ້ງຄ່າ, ໃນຂະນະທີ່ຫຼຸດຜ່ອນຄ່າໃຊ້ຈ່າຍໃນການຄິດໄລ່ຢ່າງຫຼວງຫຼາຍ.
ໃນດ້ານການນຳໃຊ້ທີ່ມີທ່າແຮງ, ເທັກໂນໂລຢີ STL ສາມາດຊ່ວຍຄູໃນການທົບທວນຄຳຖາມໃນການສອບເສັງ, ແນະນຳຄຳຕອບໂດຍອັດຕະໂນມັດຕໍ່ຄຳຖາມທີ່ບໍ່ໄດ້ຮັບຄຳຕອບ, ສະໜັບສະໜູນການໃຫ້ຄະແນນ, ແລະ ພັດທະນາລະບົບການຮຽນຮູ້ທີ່ສະຫຼາດທີ່ມີຄວາມສາມາດໃນການຕີຄວາມໝາຍຜົນການປະເມີນຜົນ.
ອີງຕາມຮອງສາດສະດາຈານ Quan Thanh Tho, ສິ່ງພິມດັ່ງກ່າວບໍ່ພຽງແຕ່ມີການປະກອບສ່ວນທີ່ໂດດເດັ່ນໃນດ້ານມູນຄ່າທາງວິຊາການຕໍ່ການຄົ້ນຄວ້າໃນຂົງເຂດ LLM ເທົ່ານັ້ນ ແຕ່ຍັງສະແດງໃຫ້ເຫັນວ່າການປັບປຸງຄວາມໜ້າເຊື່ອຖືຂອງ AI ບໍ່ຈຳເປັນຕ້ອງມາຈາກຮູບແບບຂະໜາດໃຫຍ່ກວ່າ ຫຼື ສະຖາປັດຕະຍະກຳທີ່ສັບສົນ. "ບາງຄັ້ງພຽງແຕ່ການປ່ຽນແປງເລັກນ້ອຍໃນວິທີການອອກແບບການກະຕຸ້ນສາມາດສ້າງຄວາມແຕກຕ່າງອັນໃຫຍ່ຫຼວງໃນການນຳໃຊ້ຕົວຈິງ," ສາດສະດາຈານ Tho ກ່າວ.
ເປັນຫຍັງ AI ຈຶ່ງປ່ຽນຄຳຕອບຂອງມັນ?
ອີງຕາມທີມງານຄົ້ນຄວ້າ, ວຽກງານດັ່ງກ່າວແມ່ນສຸມໃສ່ການປັບປຸງຄວາມສາມາດຂອງຮູບແບບພາສາການຂຽນໂປຣແກຣມແບບເປີດຂະໜາດໃຫຍ່ເຊັ່ນ LLaMA, DeepSeek, ແລະ Mistral ໃນການປະມວນຜົນຄຳຖາມແບບເລືອກຕອບໂດຍອັດຕະໂນມັດໂດຍບໍ່ມີຄຳແນະນຳສະເພາະ (zero-shot).
ການປ່ຽນລຳດັບຂອງຄຳຕອບ A - B - C - D, ເຖິງແມ່ນວ່າເນື້ອໃນຂອງຄຳຖາມຈະຍັງຄົງຄືເກົ່າ, ກໍສາມາດເຮັດໃຫ້ແບບຈຳລອງສ້າງຜົນໄດ້ຮັບທີ່ແຕກຕ່າງກັນໄດ້. ປະກົດການນີ້ຊີ້ໃຫ້ເຫັນວ່າແບບຈຳລອງບໍ່ເຂົ້າໃຈລັກສະນະຂອງຄຳຖາມແບບເລືອກຕອບຢ່າງແທ້ຈິງ, ແຕ່ອາດຈະໄດ້ຮັບອິດທິພົນຈາກຕຳແໜ່ງ ຫຼື ສັນຍະລັກຂອງຄຳຕອບ.
ບັນຫາແມ່ນຢູ່ໃນລັກສະນະຂອງ LLMs: ຮູບແບບເຫຼົ່ານີ້ຖືກປັບປຸງໃຫ້ດີທີ່ສຸດເພື່ອຄາດຄະເນໂທເຄັນຕໍ່ໄປ, ເຮັດໃຫ້ພວກມັນມີຄວາມອ່ອນໄຫວຕໍ່ຕຳແໜ່ງ ຫຼື ປ້າຍຊື່ຂອງຄຳຕອບແທນທີ່ຈະປະເມີນຄວາມໝາຍຕົວຈິງ.
ແຫຼ່ງຂໍ້ມູນ: https://tuoitre.vn/sinh-vien-bach-khoa-dua-luan-van-ai-len-tap-chi-q1-20260412080023156.htm







(0)