Gmail يحصل على أكبر ترقية لمرشح البريد العشوائي منذ سنوات

[إعلان_1]

نشرت جوجل مؤخرًا تدوينة أمنية تُفصّل ما وصفته بأنه أحد أهم التحديثات الدفاعية لمرشح البريد العشوائي في Gmail في السنوات الأخيرة. إنه نظام تصنيف نصوص جديد يُسمى "تحويل النصوص إلى متجهات مرنة وفعالة" (RETVec). تُشير جوجل إلى أن هذا النظام يُساعد في فهم مدى ملاءمة النص وخصوصيته، وهو رسائل بريد إلكتروني مليئة بالأحرف الخاصة والرموز التعبيرية والأخطاء الإملائية وغيرها من الرسائل غير المرغوب فيها التي كانت في السابق قابلة للقراءة من قِبَل البشر، ولكن يصعب على الأجهزة فهمها. في السابق، كانت رسائل البريد العشوائي المليئة بالأحرف الخاصة تتسلل بسهولة عبر دفاعات Gmail.

في حين أن أي مُرشِّح للرسائل غير المرغوب فيها قد يُزيل على الأرجح رسالة بريد إلكتروني تقول: "تهانينا! تمت إضافة رصيد بقيمة 1000 دولار أمريكي إلى حسابك المُربح"، إلا أن الغالبية العظمى من أحرف هذه الرسالة تتعمق في أعماق معيار يونيكود، حيث قد يجد المستخدمون أحرفًا تبدو وكأنها جزء من الأبجدية اللاتينية العادية.

تقول جوجل إن RETVec مُدرَّب ليكون مُتحمِّلاً لعمليات مستوى الأحرف، بما في ذلك عمليات الإدراج والحذف والأخطاء الإملائية والمتجانسات واستبدالات LEET، وغيرها. يُدرَّب نموذج RETVec على ترميز أحرف جديد يُمكِّنه من ترميز جميع الأحرف والكلمات في مجموعة UTF-8 بكفاءة. ونتيجةً لذلك، يتفوق RETVec على أكثر من 100 لغة دون الحاجة إلى جداول بحث أو أحجام مفردات ثابتة.

Gmail nâng cấp bộ lọc thư rác lớn nhất trong nhiều năm - Ảnh 1. — بفضل RETVec، أصبح بإمكان Gmail الآن التعرف على الرسائل غير المرغوب فيها وتصفيتها بشكل أفضل

تقول جوجل إن الفرق كبير. فالطرق التي تستخدم أحجامًا ثابتة من المفردات أو جداول بحث عن المتجانسات تستهلك موارد كثيرة. من ناحية أخرى، لا يحتوي RETVec إلا على 200,000 معلمة بدلًا من ملايين، لذا، على الرغم من ضخامة منصة جوجل السحابية لتصفية البريد العشوائي، إلا أنه يمكن تشغيلها على جهاز محلي. RETVec مفتوح المصدر، وتأمل جوجل أن يقضي على هجمات المتجانسات.

يعمل RETVec بطريقة مشابهة لنماذج التعلم الآلي TensorFlow، التي تستخدم التشابه البصري لتحديد معنى الكلمات بدلاً من محتواها الحرفي. وقد أدى هذا النهج إلى تحسينات كبيرة، حيث أفادت جوجل أن استبدال مُصنِّف البريد العشوائي في Gmail بـ RETVec حسّن معدلات اكتشاف البريد العشوائي بنسبة 38% مقارنةً بالخط الأساسي، وخفّض النتائج الإيجابية الخاطئة بنسبة 19.4%. كما أدى استخدام RETVec إلى تقليل استخدام TPU للنموذج بنسبة 83%، مما يجعل طرح RETVec أحد أكبر الترقيات في السنوات الأخيرة. وقد اختبرته الشركة داخليًا على مدار العام الماضي، وطرحته لجميع حسابات مستخدمي Gmail.

[إعلان 2]
رابط المصدر

علامة: حساب جيميل نظام الدفاع

تعليق (0)

أهم الاهتمامات

أحدث

No data