ບໍ່ດົນມານີ້ Google ໄດ້ເຜີຍແຜ່ບົດຄວາມບລັອກຄວາມປອດໄພທີ່ລະບຸລາຍລະອຽດກ່ຽວກັບຕົວກອງສະແປມຂອງ Gmail, ເຊິ່ງບໍລິສັດເອີ້ນວ່າການຍົກລະດັບການປ້ອງກັນທີ່ໃຫຍ່ທີ່ສຸດໃນຊຸມປີມໍ່ໆມານີ້. ນີ້ແມ່ນລະບົບການຈັດປະເພດຂໍ້ຄວາມໃໝ່ທີ່ເອີ້ນວ່າ Responsive and Efficient Text Vector Generator (RETVec). Google ກ່າວວ່າສິ່ງນີ້ສາມາດຊ່ວຍໃຫ້ເຂົ້າໃຈຄວາມກ່ຽວຂ້ອງ ແລະ ລັກສະນະຂອງຂໍ້ຄວາມ - ອີເມວທີ່ເຕັມໄປດ້ວຍຕົວອັກສອນພິເສດ, ອີໂມຈິ, ຄວາມຜິດພາດໃນການສະກົດຄຳ, ແລະ ຕົວອັກສອນຂີ້ເຫຍື້ອທີ່ມະນຸດສາມາດອ່ານໄດ້ກ່ອນໜ້ານີ້ ແຕ່ເຄື່ອງຈັກເຂົ້າໃຈຍາກ. ກ່ອນໜ້ານີ້, ອີເມວສະແປມທີ່ເຕັມໄປດ້ວຍຕົວອັກສອນພິເສດສາມາດຂ້າມການປ້ອງກັນຂອງ Gmail ໄດ້ຢ່າງງ່າຍດາຍ.
ເຖິງແມ່ນວ່າຕົວກອງສະແປມໃດໆກໍ່ສາມາດກັ່ນຕອງອີເມວທີ່ກ່າວວ່າ "ຊົມເຊີຍ! ຍອດເງິນ $1,000 ສາມາດໃຊ້ໄດ້ສຳລັບບັນຊີ jackpot ຂອງທ່ານແລ້ວ," ແຕ່ຕົວອັກສອນສ່ວນໃຫຍ່ໃນອີເມວຕົກຢູ່ໃນຄວາມເລິກທີ່ບໍ່ມີຂອບເຂດຂອງມາດຕະຖານ Unicode, ບ່ອນທີ່ຜູ້ໃຊ້ສາມາດຊອກຫາຕົວອັກສອນທີ່ເບິ່ງຄືວ່າເປັນສ່ວນໜຶ່ງຂອງຕົວອັກສອນລາຕິນປົກກະຕິ.
Google ກ່າວວ່າເທັກໂນໂລຢີ RETVec ໄດ້ຮັບການຝຶກອົບຮົມໃຫ້ມີຄວາມທົນທານຕໍ່ກັບການຈັດການລະດັບຕົວອັກສອນລວມທັງການໃສ່, ການລຶບ, ຄວາມຜິດພາດໃນການສະກົດ, ຄຳສັບຄ້າຍຄວາມໝາຍ, ການທົດແທນ LEET, ແລະອື່ນໆ. ຮູບແບບ RETVec ໄດ້ຮັບການຝຶກອົບຮົມກ່ຽວກັບໂຄງການເຂົ້າລະຫັດຕົວອັກສອນໃໝ່ທີ່ສາມາດເຂົ້າລະຫັດຕົວອັກສອນ ແລະ ຄຳສັບທັງໝົດໃນຊຸດ UTF-8 ໄດ້ຢ່າງມີປະສິດທິພາບ. ດັ່ງນັ້ນ, RETVec ຈຶ່ງມີປະສິດທິພາບເປັນພິເສດໃນຫຼາຍກວ່າ 100 ພາສາໂດຍບໍ່ຈຳເປັນຕ້ອງໃຊ້ຕາຕະລາງຄົ້ນຫາ ຫຼື ຂະໜາດຄຳສັບຄົງທີ່.
ຂໍຂອບໃຈ RETVec, Gmail ສາມາດຮັບຮູ້ ແລະ ກັ່ນຕອງສະແປມໄດ້ຢ່າງມີປະສິດທິພາບຫຼາຍຂຶ້ນ.
Google ກ່າວວ່າປະສິດທິພາບໄດ້ມີການປ່ຽນແປງຢ່າງຫຼວງຫຼາຍ. ວິທີການທີ່ໃຊ້ຂະໜາດຄຳສັບຄົງທີ່ ຫຼື ຕາຕະລາງຄົ້ນຫາຂອງຄຳສັບຄ້າຍຄືກັນແມ່ນໃຊ້ຊັບພະຍາກອນຫຼາຍ. ໃນທາງກົງກັນຂ້າມ, RETVec ມີພຽງແຕ່ 200,000 ແທນທີ່ຈະເປັນຫຼາຍລ້ານພາລາມິເຕີ, ສະນັ້ນໃນຂະນະທີ່ແພລະຕະຟອມການກັ່ນຕອງສະແປມທີ່ອີງໃສ່ຄລາວຂອງ Google ມີຂະໜາດໃຫຍ່ພໍ, ມັນສາມາດໃຊ້ໄດ້ໃນອຸປະກອນທ້ອງຖິ່ນ. RETVec ແມ່ນແຫຼ່ງເປີດ, ແລະ Google ຫວັງວ່າມັນຈະກຳຈັດການໂຈມຕີໂດຍໃຊ້ຄຳສັບຄ້າຍຄືກັນ.
RETVec ເຮັດວຽກຄ້າຍຄືກັນກັບວິທີທີ່ຮູບແບບການຮຽນຮູ້ຂອງເຄື່ອງຈັກ TensorFlow ໃຊ້ຄວາມຄ້າຍຄືກັນທາງສາຍຕາເພື່ອກຳນົດຄວາມໝາຍຂອງຄຳສັບແທນທີ່ຈະເປັນເນື້ອໃນຕົວຈິງຂອງມັນ. ວິທີການນີ້ໄດ້ນຳໄປສູ່ການປັບປຸງທີ່ສຳຄັນ; Google ກ່າວວ່າການປ່ຽນແທນຕົວຈັດປະເພດສະແປມຂອງ Gmail ດ້ວຍ RETVec ເຮັດໃຫ້ອັດຕາການກວດຫາສະແປມດີຂຶ້ນ 38% ເມື່ອທຽບກັບມາດຕະຖານເບື້ອງຕົ້ນ ແລະ ການຫຼຸດຜ່ອນຜົນບວກທີ່ບໍ່ຖືກຕ້ອງ 19.4%. ການນຳໃຊ້ RETVec ໄດ້ຫຼຸດຜ່ອນການນຳໃຊ້ TPU ຂອງຮູບແບບລົງ 83%, ເຮັດໃຫ້ການນຳໃຊ້ RETVec ເປັນໜຶ່ງໃນການຍົກລະດັບທີ່ໃຫຍ່ທີ່ສຸດໃນຊຸມປີມໍ່ໆມານີ້. ບໍລິສັດໄດ້ທົດສອບ RETVec ພາຍໃນໃນປີທີ່ຜ່ານມາ ແລະ ໄດ້ນຳໃຊ້ມັນກັບບັນຊີ Gmail ຂອງຜູ້ໃຊ້ທັງໝົດ.
[ໂຄສະນາ_2]
ລິ້ງແຫຼ່ງຂໍ້ມູນ






(0)