Vietnam.vn - Nền tảng quảng bá Việt Nam

Gmail bénéficie de la plus grande mise à niveau du filtre anti-spam depuis des années

Báo Thanh niênBáo Thanh niên06/12/2023


Google a récemment publié un article de blog consacré à la sécurité, détaillant ce qu'il considère comme l'une des plus importantes améliorations apportées au filtre anti-spam de Gmail ces dernières années. Il s'agit d'un nouveau système de classification de texte appelé Vectorisation de texte résiliente et efficace (RETVec). Google affirme qu'il permet de comprendre la pertinence et la spécificité du texte, c'est-à-dire des e-mails remplis de caractères spéciaux, d'emojis, de fautes d'orthographe et autres éléments indésirables, auparavant lisibles par les humains, mais difficilement compréhensibles par les machines. Auparavant, les messages de spam contenant des caractères spéciaux passaient facilement à travers les défenses de Gmail.

Même si n'importe quel filtre anti-spam éliminerait probablement un courriel du type « Félicitations ! Un solde de 1 000 $ a été ajouté à votre compte jackpot », la grande majorité des lettres de ce courriel sont cryptées dans les profondeurs de la norme Unicode, où les utilisateurs peuvent trouver des caractères qui semblent appartenir à l'alphabet latin classique.

Google affirme que RETVec est entraîné pour résister aux opérations au niveau des caractères, notamment les insertions, les suppressions, les fautes d'orthographe, les homonymes, les substitutions LEET, etc. Le modèle RETVec est entraîné sur un nouvel encodage de caractères capable d'encoder efficacement tous les caractères et mots de l'ensemble UTF-8. Ainsi, RETVec surpasse plus de 100 langues sans nécessiter de tables de correspondance ni de tailles de vocabulaire fixes.

Gmail nâng cấp bộ lọc thư rác lớn nhất trong nhiều năm - Ảnh 1.

Grâce à RETVec, Gmail peut désormais mieux reconnaître et filtrer les spams

Google affirme que la différence est considérable. Les méthodes utilisant des tailles de vocabulaire fixes ou des tables de correspondance pour les homonymes sont gourmandes en ressources. RETVec, en revanche, ne compte que 200 000 paramètres au lieu de millions. Ainsi, malgré sa taille, la plateforme cloud de filtrage anti-spam de Google peut fonctionner sur une machine locale. RETVec est open source et Google espère qu'il éliminera les attaques par homonymes.

RETVec fonctionne de manière similaire aux modèles d'apprentissage automatique TensorFlow, qui utilisent la similarité visuelle pour déterminer le sens des mots plutôt que leur contenu textuel. Cette approche a permis d'importantes améliorations : Google affirme que le remplacement du classificateur de spam de Gmail par RETVec a amélioré les taux de détection de spam de 38 % par rapport à la référence et réduit les faux positifs de 19,4 %. L'utilisation de RETVec a permis de réduire l'utilisation de TPU du modèle de 83 %, faisant de son déploiement l'une des plus importantes améliorations de ces dernières années. L'entreprise teste RETVec en interne depuis un an et l'a déployé sur tous les comptes Gmail de ses utilisateurs.



Lien source

Comment (0)

No data
No data

Même sujet

Même catégorie

Découvrez le seul village du Vietnam dans le top 50 des plus beaux villages du monde
Pourquoi les lanternes à drapeau rouge avec des étoiles jaunes sont-elles populaires cette année ?
Le Vietnam remporte le concours musical Intervision 2025
Embouteillages à Mu Cang Chai jusqu'au soir, les touristes affluent pour chasser le riz mûr de la saison

Même auteur

Patrimoine

Chiffre

Entreprise

No videos available

Événements actuels

Système politique

Locale

Produit