Vietnam.vn - Nền tảng quảng bá Việt Nam

ຮູບແບບ AI ຕ້ອງການຊຸດມາດຕະຖານທີ່ປະເມີນຄວາມສາມາດທີ່ສັບສົນຢ່າງເລິກເຊິ່ງ

ການພັດທະນາຢ່າງໄວວາຂອງແບບຈໍາລອງ AI ທີ່ທັນສະໄຫມແມ່ນຮຽກຮ້ອງໃຫ້ມີມາດຕະຖານການປະເມີນຜົນຢ່າງກວ້າງຂວາງສໍາລັບຄວາມສາມາດທີ່ຊັບຊ້ອນ, ສ້າງແຮງກະຕຸ້ນສໍາລັບການພັດທະນາແບບຈໍາລອງ LLM ລະດັບສູງ.

ZNewsZNews03/10/2025


ບົດລາຍງານສະຖານະການພັດທະນາ (LLM) 2024 (LLM) ຂອງ VMLU (ເວທີການຮຽນຮູ້, ປະເມີນ ແລະຈັດອັນດັບສໍາລັບ LLMs ພາສາຫວຽດນາມ) ໄດ້ສະແດງໃຫ້ເຫັນເຖິງການເພີ່ມຂຶ້ນຢ່າງຫຼວງຫຼາຍຂອງຈໍານວນ LLMs ທີ່ສຸມໃສ່ພາສາຫວຽດນາມ. ໂດຍສະເພາະ, ເວທີ VMLU ໄດ້ເຜີຍແຜ່ 45 LLMs ໃນການຈັດອັນດັບ, ໄດ້ຮັບການຮ້ອງຂໍການປະເມີນຜົນຈາກຫຼາຍກວ່າ 155 ອົງການຈັດຕັ້ງແລະບຸກຄົນ, ແລະສະຫຼຸບການດາວໂຫລດ 691 ມາດຕະຖານການປະເມີນຜົນແລະການປະເມີນຜົນຂອງ LLM 3,729 ຈາກເວທີໃນປີ 2024.

ຫຼາຍອົງການຈັດຕັ້ງພາຍໃນ ແລະ ຕ່າງປະເທດໄດ້ນຳໃຊ້ VMLU ເຊັ່ນ: VinBigData, VNPT AI, Viettel Solutions, University of Technology - VNU-HCM, UONLP x Ontocord - University of Oregon (USA), DAMO Academy - Alibaba Group, ທີມ SDSRV - Samsung...

VMLU ພາ​ສາ​ອັງ​ກິດ 1​

VMLU ຈະເປີດຕົວເງື່ອນໄຂການປະເມີນ LLM ຊຸດທໍາອິດໃນປີ 2023.

ຄຽງຄູ່ກັບການຂະຫຍາຍຕົວຂອງປະລິມານ, ຄຸນນະພາບຂອງແບບຈໍາລອງ LLM ຍັງໄດ້ຮັບການປັບປຸງເພີ່ມຂຶ້ນ. ຖ້າຫາກວ່າໃນອະດີດ, LLMs ໄດ້ຮັບການຝຶກອົບຮົມກ່ຽວກັບຄວາມຮູ້ພື້ນຖານ, ໃນປັດຈຸບັນນັກພັດທະນາສຸມໃສ່ການຂະຫຍາຍຄວາມສາມາດເພີ່ມເຕີມເຊັ່ນ: ການອ່ານຄວາມເຂົ້າໃຈ, ການແລກປ່ຽນການສົນທະນາຫຼືການສົມເຫດສົມຜົນຂອງມະນຸດ.

ຕອບສະໜອງຕໍ່ການພັດທະນາຢ່າງແຂງແຮງຂອງບັນດາຕົວແບບ LLM ຂອງຫວຽດນາມ ທີ່ກ້າວໜ້າ, VMLU ໄດ້ເຜີຍແຜ່ບັນດາມາດຖານໃໝ່ເພື່ອຕີລາຄາຕື່ມອີກບັນດາຄວາມສາມາດບົ່ມຊ້ອນຂອງບັນດາຕົວແບບ.

ມາດຕະຖານທີ່ສົ່ງເສີມຄວາມເປັນເລີດ LLM

ກ່ອນ​ໜ້າ​ນີ້, ເມື່ອ​ຕະຫຼາດ​ຂາດ​ມາດ​ຕະ​ຖານ​ດ້ານ​ຄຸນ​ນະ​ພາບ, ຫຼາຍ​ກຸ່ມ​ຄົ້ນ​ຄ້​ວາ​ພາຍ​ໃນ​ປະ​ເທດ​ຕ້ອງ​ສ້າງ​ເຄື່ອງ​ມື​ປະ​ເມີນ​ພາຍ​ໃນ​ດ້ວຍ​ມາດ​ຕະ​ຖານ​ຂອງ​ຕົນ. ນີ້ຈໍາກັດການປະເມີນຜົນເຊັ່ນດຽວກັນກັບການປຽບທຽບຄຸນນະພາບຂອງຕົວແບບກັບ LLMs ທີ່ມີຢູ່ໃນຕະຫຼາດເພື່ອໃຫ້ມີກົນລະຍຸດການຝຶກອົບຮົມທີ່ເຫມາະສົມ.

​ເພື່ອ​ແກ້​ໄຂ​ບັນຫາ​ດັ່ງກ່າວ, ​ໃນ​ເດືອນ​ພະຈິກ 2023, VMLU - ຊຸດ​ທຳ​ອິດ​ຂອງ​ມາດຕະຖານ “ຜະລິດ​ຢູ່​ຫວຽດນາມ” ​ໄດ້​ຮັບ​ການ​ຄົ້ນຄວ້າ​ໂດຍ​ຄະນະ​ຜູ້​ຊ່ຽວຊານ​ຂັ້ນ​ສູງ​ຫວຽດນາມ ​ແລະ ສະໜອງ​ໃຫ້​ປະຊາ​ຄົມ​ໂດຍ​ບໍ່​ເສຍ​ຄ່າ.

ຊຸດມາດຕະຖານຂອງ 10,880 ຄໍາຖາມແບບຫຼາຍທາງເລືອກ, ກວມເອົາ 58 ຫົວຂໍ້, ແບ່ງອອກເປັນຫຼາຍລະດັບ, ໄດ້ຊ່ວຍໃຫ້ນັກພັດທະນາເຂົ້າເຖິງຊຸດຂໍ້ມູນການປະເມີນທົ່ວໄປໄດ້ຢ່າງງ່າຍດາຍ. ໃນເວລາດຽວກັນ, ໃຊ້ປະໂຫຍດຈາກການຈັດອັນດັບຂອງ VMLU ເພື່ອປຽບທຽບຕົວແບບຂອງພວກເຂົາໂດຍກົງກັບ LLMs ທີ່ມີຢູ່ໃນຕະຫຼາດ.

ທ່ານ ດັ້ງ​ທິງ​ອກ​ທິ້ງ, ຫົວໜ້າ​ກົມ​ປຸງ​ແຕ່ງ​ພາສາ​ທຳ​ມະ​ຊາດ - VinBigData Virtual Assistant Technology Block, ​ເຊິ່ງຕົວ​ແບບ ViGPT-1.6B-v1 ​ແມ່ນ​ຢູ່​ໃນ​ການ​ຈັດ​ອັນ​ດັບ​ຕົວ​ແບບ​ຈາກ​ຮອຍ​ຂີດ​ຂ່ວນ (LLM ​ໄດ້​ຮັບ​ການ​ຝຶກ​ອົບ​ຮົມ​ຈາກ​ scratch) ຂອງ VMLU ​ໃຫ້​ຮູ້​ວ່າ: “VMLU ມີ​ຂໍ້​ມູນ​ທີ່​ຄົບ​ຖ້ວນ ​ແລະ ຄົບ​ຖ້ວນ​ເພື່ອ​ຕີ​ລາຄາ​ຄວາມ​ສາມາດ​ຄວາມ​ຮູ້​ຂອງ LLM ຂອງ​ຫວຽດນາມ ​ໃນ​ແຕ່ລະ​ຂົງ​ເຂດ. ຂັ້ນຕອນ, ແຕ່ຍັງເປັນການວັດແທກປະສິດທິພາບຂອງການທົດລອງຂອງພວກເຮົາໃນລະຫວ່າງຂະບວນການຝຶກອົບຮົມ."

ທ່ານດຣ ດັ້ງທິງໄທ ກ່າວຕື່ມວ່າ: “ນີ້ຈະເປັນ 'ສະເປປຣິງບອດ' ເພື່ອສົ່ງເສີມການພັດທະນາຂອງ AI ໂດຍທົ່ວໄປ ແລະ LLM ໂດຍສະເພາະ, ເພາະວ່າພວກເຮົາຕ້ອງມີມາດຕະຖານທີ່ດີ ເພື່ອໃຫ້ພວກເຮົາມີພື້ນຖານໃນການຝຶກອົບຮົມຕົວແບບທີ່ມີຄຸນນະພາບສູງ.

ຜູ້ອຳນວຍການໃຫຍ່ Microsoft - ດຣ Bach Hung Nguyen ກໍ່ຢືນຢັນເຖິງຜົນປະໂຫຍດຂອງ VMLU ໃນການຕີລາຄາການປະຕິບັດຕົວແບບ LLM ເປັນພາສາຫວຽດນາມ, ຊ່ວຍໃຫ້ບັນດາຫົວໜ່ວຍພັດທະນາເຂົ້າໃຈຄວາມສາມາດຂອງຕົວແບບໄດ້ດີຂຶ້ນ. ນອກຈາກນັ້ນ, ທ່ານດຣ ບັກຮົ່ງຫງວຽນ ຍັງຄາດຫວັງວ່າ VMLU ຈະເພີ່ມຊຸດທັກສະທີ່ເປັນປະໂຫຍດເຊັ່ນ: ການໃຫ້ເຫດຜົນ, ການສ້າງລະຫັດ, ແລະການສະຫຼຸບຂໍ້ຄວາມ.

ຮຸ່ນໃຫມ່ຂອງ VMLU ມີຈຸດປະສົງເພື່ອໃຫ້ຮູບແບບ LLM ທີ່ມີຄໍາສັ່ງສູງກວ່າທີ່ສົມບູນແບບ

ບໍ່ດົນມານີ້, VMLU ຍັງສືບຕໍ່ປະກາດຊຸດມາດຕະຖານໃຫມ່, ການປະເມີນຄວາມສາມາດໃນການສົມເຫດສົມຜົນແລະການໂຕ້ຕອບຂອງ LLM. ຊຸດມາດຕະຖານທີ່ຂະຫຍາຍໄດ້ປະເມີນ 3 ທັກສະຫຼັກຂອງ LLM ທີ່ທັນສະໄຫມ, ລວມທັງ:

Reading Comprehension (ViSQuAD) : 3,310 ຄໍາ​ຖາມ​ປະ​ເມີນ​ຄວາມ​ສາ​ມາດ​ທີ່​ຈະ​ເຂົ້າ​ໃຈ​ຂໍ້​ຄວາມ​ໃນ​ຄວາມ​ເລິກ​ແລະ​ການ​ແກ້​ໄຂ​ຄໍາ​ຖາມ​ສະ​ລັບ​ສັບ​ຊ້ອນ​ໂດຍ​ອີງ​ໃສ່​ລັກ​ສະ​ນະ​ສະ​ເພາະ​ຂອງ​ພາ​ສາ​ແລະ​ສະ​ພາບ​ການ​ຂອງ​ຫວຽດ​ນາມ​.

ການໃຫ້ເຫດຜົນ (ViDrop) : 3,090 ຄໍາຖາມທ້າທາຍຄວາມສາມາດໃນການສົມເຫດສົມຜົນຢ່າງມີເຫດຜົນຂອງ LLM ໂດຍຜ່ານວຽກງານເຊັ່ນ: ການປຽບທຽບ, ການນັບ, ແລະການຄິດໄລ່ເລກເລກ.

ການໂຕ້ຕອບ (ViDialog) : 210 ການສົນທະນາປະເມີນຄວາມສອດຄ່ອງ, ຄວາມສາມາດໃນການເຂົ້າໃຈສະພາບການແລະນໍາໃຊ້ຄວາມຮູ້ຫຼາຍດ້ານ (ປະຫວັດສາດ, ພູມສາດ, ເຫດຜົນ) ໃນການປຶກສາຫາລື.

ການຍົກລະດັບນີ້ບໍ່ພຽງແຕ່ຊ່ວຍໃຫ້ນັກພັດທະນາປະເມີນແບບຈໍາລອງໄດ້ຢ່າງກວ້າງຂວາງ, ແຕ່ຍັງສົ່ງເສີມ LLM ເພື່ອສ້າງຄຸນຄ່າທີ່ເປັນປະໂຫຍດສໍາລັບຜູ້ໃຊ້ສຸດທ້າຍ.

ອ້າຍ VMLU 2

ມາດຕະຖານ VMLU ໃໝ່ ທີ່ຈະອອກມາໃນປີ 2025.

ດຣ ເຈົາແທ່ງດຶກ, ຜູ້ອໍານວຍການຝ່າຍຄົ້ນຄວ້າ ແລະພັດທະນາປັນຍາປະດິດ ຢູ່ Zalo AI, ອົງການພັດທະນາ VMLU, ໃຫ້ຮູ້ວ່າ: “ປະຈຸບັນ ໃນທົ່ວໂລກ ມີຫຼາຍຮ້ອຍມາດຖານທີ່ແຕກຕ່າງກັນເພື່ອຕີລາຄາຄວາມສາມາດຂອງຕົວແບບພາສາໃຫຍ່. ເຖິງຢ່າງໃດກໍ່ຕາມ, ຕົວເລກມາດຕະຖານການປະເມີນສະເພາະຂອງຫວຽດນາມ ແມ່ນມີຄວາມຈຳກັດຫຼາຍ, ດ້ວຍການເປີດຕົວມາດຕະຖານໃນປີ 2023 ແລະ 2025.

ຊຸດມາດຕະຖານໃຫມ່ໄດ້ຖືກເປີດຕົວຢູ່ໃນເວັບໄຊທ໌ VMLU https://vmlu.ai/ ສໍາລັບບຸກຄົນແລະກຸ່ມຄົ້ນຄ້ວາເພື່ອປະເມີນແບບຈໍາລອງຂອງພວກເຂົາ.

ອ້າຍ VMLU 3

ຊຸດມາດຕະຖານໃຫມ່ໄດ້ຖືກປັບປຸງຢູ່ໃນເວັບໄຊທ໌ VMLU.

VMLU ​ແມ່ນ​ເວທີ​ປາ​ໄສ​ຕີ​ລາຄາ ​ແລະ ຈັດ​ອັນ​ດັບ​ບັນດາ​ຕົວ​ແບບ LLM ຂອງ​ຫວຽດນາມ ສ້າງ​ໂດຍ Zalo AI ສົມທົບ​ກັບ​ສະ​ຖາ​ບັນ ​ວິທະຍາສາດ ​ແລະ ​ເຕັກ​ໂນ​ໂລ​ຊີ​ຂັ້ນສູງ​ຍີ່ປຸ່ນ (JAIST) ​ໂດຍ​ບໍ່​ເສຍ​ຄ່າ​ໃຊ້​ຈ່າຍ​ໃຫ້​ປະຊາ​ຄົມ​ແຕ່​ເດືອນ 11/2023. ຜ່ານ​ນັ້ນ, ປະ​ກອບ​ສ່ວນ​ເຂົ້າ​ໃນ​ຍຸກ​ພັດ​ທະ​ນາ​ເຕັກ​ໂນ​ໂລ​ຊີ​ຂອງ​ປະ​ເທດ​ດ້ວຍ​ບັນ​ດາ​ທິດ​ທາງ​ວິ​ທະ​ຍາ​ສາດ, ເຕັກ​ໂນ​ໂລ​ຊີ, ນະ​ວັດ​ຕະ​ກຳ ແລະ ການ​ຫັນ​ເປັນ​ດິ​ຈິ​ຕອນ​ແຫ່ງ​ຊາດ.

ທີ່ມາ: https://znews.vn/mo-hinh-ai-dang-can-bo-tieu-chuan-danh-gia-sau-cac-nang-luc-phuc-tap-post1589901.html


(0)

No data
No data

ຊົມ​ລົມ​ເຂດ​ຝັ່ງ​ທະ​ເລ Gia Lai ທີ່​ເຊື່ອງ​ໄວ້​ໃນ​ເມກ
ຢ້ຽມ​ຢາມ​ໝູ່​ບ້ານ​ປະ​ມົງ Lo Dieu ຢູ່ Gia Lai ເພື່ອ​ເບິ່ງ​ຊາວ​ປະ​ມົງ 'ແຕ້ມ​ຮູບ” ຫົວ​ຜັກ​ກາດ​ຢູ່​ທະ​ເລ
Locksmith ປ່ຽນກະປ໋ອງເບຍໃຫ້ເປັນໂຄມໄຟກາງລະດູໃບໄມ້ຫຼົ່ນທີ່ສົດໃສ
ໃຊ້ເວລາຫຼາຍລ້ານເພື່ອຮຽນຮູ້ການຈັດດອກໄມ້, ຊອກຫາປະສົບການຄວາມຜູກພັນໃນງານບຸນກາງດູໃບໄມ້ລົ່ນ

ມໍລະດົກ

;

ຮູບ

;

ທຸລະກິດ

;

No videos available

ເຫດການປະຈຸບັນ

;

ລະບົບການເມືອງ

;

ທ້ອງຖິ່ນ

;

ຜະລິດຕະພັນ

;