ວຽກງານຄົ້ນຄ້ວາເພື່ອຊ່ວຍເພີ່ມຄວາມຖືກຕ້ອງຂອງຕົວແບບການຮັບຮູ້ສຽງເວົ້າໃນເວລາຈິງ (Streaming Automatic Speech Recognition) ໂດຍ Le Duy Khanh - ວິສະວະກອນ "GenZ" ຂອງ Zalo AI - ຈະໄດ້ຮັບການປະກາດເປັນຄັ້ງທຳອິດທີ່ກອງປະຊຸມ ວິທະຍາສາດ ສາກົນ ທີ່ຈັດຂຶ້ນຢູ່ປະເທດເກຼັກ ໃນເດືອນ 9/2024.
ດ້ວຍ ຫົວຂໍ້ " ການປັບປຸງການຮັບຮູ້ສຽງເວົ້າດ້ວຍການໃສ່ໃຈໃນສະພາບການທີ່ມີການປ່ຽນແປງເວລາແລະການປິດບັງເນື້ອຫາທີ່ຖືກຕ້ອງແບບເຄື່ອນໄຫວ " , ເອກະສານການຄົ້ນຄວ້າຂອງວິສະວະກອນ Zalo AI ທີ່ເກີດໃນປີ 2000 ໄດ້ບັນລຸຄະແນນເກືອບທີ່ສົມບູນແບບ - 11/12 ຄະແນນ, ຜ່ານຮອບທົບທວນຢ່າງເຂັ້ມງວດໂດຍມີຫຼາຍກວ່າ 2,000 ເອກະສານທີ່ເຂົ້າຮ່ວມໃນກອງ ປະ ຊຸມ.
“ ຂ້າພະເຈົ້າມີຄວາມພາກພູມໃຈທີ່ບົດຂຽນວິທະຍາສາດຄັ້ງທຳອິດຂອງຂ້າພະເຈົ້າໄດ້ຮັບການຮັບຮູ້ຈາກກອງປະຊຸມວິທະຍາສາດທີ່ມີຊື່ສຽງ ແລະ ຂ້າພະເຈົ້າໄດ້ມີໂອກາດແນະນຳຜົນສຳເລັດການຄົ້ນຄ້ວາຂອງຫວຽດນາມ ໃຫ້ແກ່ບັນດານັກເຕັກໂນໂລຢີໃຫຍ່, ນັກຊ່ຽວຊານ ແລະ ປະຊາຄົມສາກົນ ,” Le Duy Khanh ແບ່ງປັນ.
ພາຍໃຕ້ການຊີ້ນຳຂອງທ່ານ ດ ຣ ເຈົາແທ່ງດຶກ, ຫົວໜ້າກົມຄົ້ນຄວ້າ ແລະ ພັດທະນາ Zalo AI, ອາຈານສອນຢູ່ມະຫາວິທະຍາໄລວິທະຍາສາດທຳມະຊາດ (ມະຫາວິທະຍາໄລແຫ່ງຊາດ ນະຄອນໂຮ່ຈີມິນ), ໂຄງການຄົ້ນຄວ້ານີ້ຄາດວ່າຈະປະກອບສ່ວນສຳຄັນເຂົ້າໃນການຍົກລະດັບຮູບແບບການຮັບຮູ້ສຽງເວົ້າ, ເພີ່ມທະວີຄວາມຖືກຕ້ອງຂອງເຄື່ອງໝາຍສຽງ ແລະ ສຽງກັບຕົວໜັງສືໃນແອັບ Zalo.
“ ການສັງລວມບັນດາບົດຄົ້ນຄວ້າຕົວຈິງຂອງ Zalo AI ເຂົ້າໃນບັນດາເອກະສານວິທະຍາສາດ ແລະ ສະເໜີຢູ່ບັນດາກອງປະຊຸມສາກົນທີ່ມີຊື່ສຽງ, ມີຄວາມໝາຍທີ່ສຸດ, ບໍ່ພຽງແຕ່ສະແດງໃຫ້ເຫັນຄວາມສາມາດຂອງນັກວິສະວະກອນຫວຽດນາມ, ແຕ່ຍັງສະແດງໃຫ້ເຫັນຄວາມປາດຖະໜາຢາກແບ່ງປັນປະສົບການ, ປະກອບສ່ວນເຂົ້າໃນການພັດທະນາປະຊາຄົມ AI ທົ່ວໂລກ” .
ກ່ອນຫນ້ານີ້, Zalo ໄດ້ປະສົມປະສານການຄົ້ນຄວ້ານີ້ເຂົ້າໃນຄໍາຮ້ອງສະຫມັກການສົ່ງຂໍ້ຄວາມຂອງຕົນຕັ້ງແຕ່ທ້າຍປີ 2023, ຊ່ວຍໃຫ້ການປັບປຸງຄວາມຖືກຕ້ອງຂອງຄຸນສົມບັດ "ອົງປະກອບຂໍ້ຄວາມສຽງ". ຄຸນສົມບັດນີ້ຊ່ວຍໃຫ້ຜູ້ໃຊ້ສາມາດຂຽນຂໍ້ຄວາມດ້ວຍສຽງແທນການພິມດ້ວຍມື, ປະຢັດເວລາ ແລະ ເຮັດໃຫ້ມັນສະດວກກວ່າໃນຫຼາຍສະຖານະການນຳໃຊ້. ໃນເວລາດຽວກັນ, ຄວາມຖືກຕ້ອງຂອງຄຸນນະສົມບັດນີ້ໄດ້ບັນລຸ 95% ໃນການປະຕິບັດ; ອັດຕາການຕ້ອງການແກ້ໄຂຂໍ້ຄວາມຄືນໃຫມ່ຫຼັງຈາກການຂຽນດ້ວຍສຽງໄດ້ຫຼຸດລົງຈາກ 6,4% ເປັນ 4,8%.
ອີງຕາມສະຖິຕິ Zalo, ເຖິງແມ່ນວ່າຄຸນນະສົມບັດຍັງຢູ່ໃນຂັ້ນຕອນການທົດສອບ, ມັນໄດ້ສ້າງເກືອບ 4.5 ລ້ານຂໍ້ຄວາມຕໍ່ມື້ແລະດຶງດູດຜູ້ໃຊ້ປະມານ 3.2 ລ້ານຄົນຕໍ່ເດືອນ (ຂໍ້ມູນຖືກປັບປຸງໃຫ້ເດືອນມິຖຸນາ 2024).
ນັບຕັ້ງແຕ່ເລີ່ມຕົ້ນການເດີນທາງບຸກເບີກຂອງຕົນໃນການຄົ້ນຄວ້າ AI ໃນປີ 2017, Zalo ໄດ້ເຊື່ອສະເຫມີໃນ "ສ້າງຄວາມເຂັ້ມແຂງ" ລຸ້ນຫນຸ່ມ. ໃນປັດຈຸບັນ, ເຖິງ 31% ຂອງພະນັກງານ Zalo ແມ່ນຂຶ້ນກັບການຜະລິດ GenZ. ໃນປີ 2021, ສອງຫົວຂໍ້ການຄົ້ນຄວ້າອື່ນໆຂອງທີມງານວິສະວະກໍາ Zalo AI ທີ່ກ່ຽວຂ້ອງກັບເຕັກໂນໂລຢີການປຸງແຕ່ງຄໍາເວົ້າຍັງໄດ້ຮັບການຍອມຮັບໃນກອງປະຊຸມສາກົນອາຊີ - ປາຊີຟິກ ກ່ຽວກັບປັນຍາປະດິດ (PRICAI 2021). ເປັນທີ່ຫນ້າສັງເກດ, ຜູ້ຂຽນຂອງທັງສອງຫົວຂໍ້ນີ້ແມ່ນນັກຄົ້ນຄວ້າໄວຫນຸ່ມທີ່ມີອາຍຸຕ່ໍາກວ່າ 30 ປີ.
Interspeech ແມ່ນກອງປະຊຸມສາກົນທີ່ຍາວນານ, ທີ່ສົມບູນແບບແລະມີຊື່ສຽງກ່ຽວກັບການປຸງແຕ່ງການປາກເວົ້າທີ່ຈັດໂດຍສະມາຄົມການສື່ສານຄໍາເວົ້າລະຫວ່າງປະເທດ. ໃນປີນີ້, ກອງປະຊຸມທີ່ມີຫົວຂໍ້ "ການປາກເວົ້າ ແລະ ນອກ " ຈະຈັດຂຶ້ນໃນວັນທີ 1-5 ເດືອນກັນຍາ 2024 ຢູ່ເກາະ Kos (ເກຣັກ).










(0)