ບໍ່ດົນມານີ້ Google ໄດ້ເຜີຍແຜ່ບົດຄວາມ blog ຄວາມປອດໄພທີ່ລາຍລະອຽດກ່ຽວກັບສິ່ງທີ່ມັນເອີ້ນວ່າການຍົກລະດັບການປ້ອງກັນທີ່ໃຫຍ່ທີ່ສຸດຂອງ Gmail ໃນຊຸມປີທີ່ຜ່ານມາ. ມັນເປັນລະບົບການຈັດປະເພດຂໍ້ຄວາມໃໝ່ທີ່ເອີ້ນວ່າ Resilient and Efficient Text Vectorization (RETVec). Google ກ່າວວ່າມັນສາມາດຊ່ວຍເຂົ້າໃຈຄວາມກ່ຽວຂ້ອງແລະຄວາມສະເພາະຂອງຂໍ້ຄວາມ, ເຊິ່ງເປັນອີເມວທີ່ເຕັມໄປດ້ວຍຕົວອັກສອນພິເສດ, emojis, ການສະກົດຜິດ, ແລະຂີ້ເຫຍື້ອອື່ນໆທີ່ມະນຸດສາມາດອ່ານໄດ້ໃນເມື່ອກ່ອນແຕ່ບໍ່ໄດ້ເຂົ້າໃຈໄດ້ງ່າຍໂດຍເຄື່ອງຈັກ. ກ່ອນຫນ້ານີ້, ຂໍ້ຄວາມຂີ້ເຫຍື້ອທີ່ເຕັມໄປດ້ວຍຕົວລະຄອນພິເສດໄດ້ຜ່ານການປ້ອງກັນຂອງ Gmail ໄດ້ຢ່າງງ່າຍດາຍ.
ໃນຂະນະທີ່ຕົວກອງ spam ອາດຈະກໍາຈັດອີເມວທີ່ອ່ານວ່າ, "ຊົມເຊີຍ! ຍອດເງິນ 1,000 ໂດລາໄດ້ຖືກເພີ່ມເຂົ້າໃນບັນຊີ jackpot ຂອງທ່ານ," ຕົວອັກສອນສ່ວນໃຫຍ່ໃນອີເມວເຂົ້າໄປໃນຄວາມເລິກທີ່ບໍ່ມີທີ່ສິ້ນສຸດຂອງມາດຕະຖານ Unicode, ບ່ອນທີ່ຜູ້ໃຊ້ອາດຈະຊອກຫາຕົວອັກສອນທີ່ເບິ່ງຄືວ່າພວກເຂົາເປັນສ່ວນຫນຶ່ງຂອງຕົວອັກສອນລາຕິນປົກກະຕິ.
Google ກ່າວວ່າ RETVec ໄດ້ຮັບການຝຶກອົບຮົມໃຫ້ມີຄວາມຢືດຢຸ່ນຕໍ່ການປະຕິບັດລະດັບຕົວອັກສອນລວມທັງການແຊກ, ການລຶບ, ການສະກົດຄໍາຜິດ, ຄໍາດຽວກັນ, ການທົດແທນ LEET, ແລະອື່ນໆ. ຮູບແບບ RETVec ໄດ້ຮັບການຝຶກອົບຮົມກ່ຽວກັບການເຂົ້າລະຫັດຕົວອັກສອນໃຫມ່ທີ່ສາມາດເຂົ້າລະຫັດຕົວອັກສອນແລະຄໍາສັບຕ່າງໆໃນຊຸດ UTF-8 ໄດ້ຢ່າງມີປະສິດທິພາບ. ດັ່ງນັ້ນ, RETVec ປະຕິບັດຫຼາຍກວ່າ 100 ພາສາໂດຍບໍ່ຈໍາເປັນຕ້ອງມີຕາຕະລາງຊອກຫາຫຼືຂະຫນາດຄໍາສັບທີ່ຄົງທີ່.
ຂໍຂອບໃຈກັບ RETVec, ດຽວນີ້ Gmail ສາມາດຮັບຮູ້ ແລະກັ່ນຕອງ spam ໄດ້ດີຂຶ້ນ
Google ກ່າວວ່າຄວາມແຕກຕ່າງແມ່ນຢ່າງຫຼວງຫຼາຍ. ວິທີທີ່ໃຊ້ຂະໜາດຄຳສັບຄົງທີ່ ຫຼືຕາຕະລາງຊອກຫາຄຳສັບຄ້າຍຄືກັນແມ່ນໃຊ້ຊັບພະຍາກອນຫຼາຍ. ໃນທາງກົງກັນຂ້າມ, RETVec ມີພຽງແຕ່ 200,000 ຕົວກໍານົດການແທນທີ່ຈະເປັນລ້ານ, ດັ່ງນັ້ນ, ໃນຂະນະທີ່ແພລະຕະຟອມການກັ່ນຕອງຂີ້ເຫຍື້ອຂອງ Google ມີຂະຫນາດໃຫຍ່, ມັນສາມາດດໍາເນີນການຢູ່ໃນເຄື່ອງທ້ອງຖິ່ນ. RETVec ແມ່ນແຫຼ່ງເປີດ, ແລະ Google ຫວັງວ່າມັນຈະລົບລ້າງການໂຈມຕີ homonym.
RETVec ເຮັດວຽກໃນລັກສະນະທີ່ຄ້າຍຄືກັນກັບຕົວແບບການຮຽນຮູ້ເຄື່ອງຈັກ TensorFlow, ເຊິ່ງໃຊ້ຄວາມຄ້າຍຄືກັນທາງສາຍຕາເພື່ອກໍານົດຄວາມຫມາຍຂອງຄໍາສັບຕ່າງໆແທນທີ່ຈະເປັນເນື້ອໃນຕົວລະຄອນຕົວຈິງ. ວິທີການນີ້ໄດ້ນໍາໄປສູ່ການປັບປຸງອັນໃຫຍ່ຫຼວງ, ໂດຍ Google ກ່າວວ່າການທົດແທນ spam classifier ຂອງ Gmail ກັບ RETVec ປັບປຸງອັດຕາການກວດພົບ spam ໂດຍ 38% ໃນໄລຍະພື້ນຖານແລະຫຼຸດລົງໃນທາງບວກທີ່ບໍ່ຖືກຕ້ອງ 19.4%. ການນໍາໃຊ້ RETVec ຫຼຸດລົງການນໍາໃຊ້ TPU ຂອງຕົວແບບລົງ 83%, ເຮັດໃຫ້ການເປີດຕົວ RETVec ເປັນຫນຶ່ງໃນການຍົກລະດັບທີ່ໃຫຍ່ທີ່ສຸດໃນຊຸມປີທີ່ຜ່ານມາ. ບໍລິສັດໄດ້ທົດສອບ RETVec ພາຍໃນສໍາລັບປີທີ່ຜ່ານມາແລະໄດ້ rolled ມັນອອກໃນບັນຊີ Gmail ຜູ້ໃຊ້ທັງຫມົດ.
ແຫຼ່ງທີ່ມາ
(0)