Vietnam.vn - Nền tảng quảng bá Việt Nam

O Gmail recebe a maior atualização de filtro de spam em anos.

Báo Thanh niênBáo Thanh niên06/12/2023


O Google publicou recentemente um artigo em seu blog de segurança detalhando o que considera uma das maiores melhorias de defesa para o filtro de spam do Gmail nos últimos anos. Trata-se de um novo sistema de classificação de texto chamado Vetorização de Texto Resiliente e Eficiente (RETVec). O Google afirma que ele pode ajudar a entender a relevância e a especificidade do texto, que consiste em e-mails repletos de caracteres especiais, emojis, erros ortográficos e outros elementos indesejados que antes eram legíveis para humanos, mas não facilmente compreendidos por máquinas. Anteriormente, mensagens de spam com caracteres especiais passavam facilmente pelas defesas do Gmail.

Embora qualquer filtro de spam provavelmente elimine um e-mail que diga: “Parabéns! Um saldo de US$ 1.000 foi adicionado à sua conta de prêmio acumulado”, a grande maioria das letras no e-mail se perde nas profundezas do padrão Unicode, onde os usuários podem encontrar caracteres que parecem fazer parte do alfabeto latino comum.

O Google afirma que o RETVec foi treinado para ser resistente a operações em nível de caractere, incluindo inserções, exclusões, erros ortográficos, homônimos, substituições LEET e muito mais. O modelo RETVec é treinado em uma nova codificação de caracteres que pode codificar com eficiência todos os caracteres e palavras do conjunto UTF-8. Como resultado, o RETVec supera mais de 100 idiomas sem exigir tabelas de consulta ou tamanhos de vocabulário fixos.

Gmail nâng cấp bộ lọc thư rác lớn nhất trong nhiều năm - Ảnh 1.

Graças ao RETVec, o Gmail agora consegue reconhecer e filtrar spam com mais eficiência.

O Google afirma que a diferença é drástica. Métodos que utilizam tamanhos de vocabulário fixos ou tabelas de consulta para homônimos consomem muitos recursos. O RETVec, por outro lado, possui apenas 200.000 parâmetros em vez de milhões, portanto, embora a plataforma de nuvem de filtragem de spam do Google seja grande, ela pode ser executada em uma máquina local. O RETVec é de código aberto e o Google espera que ele elimine os ataques de homônimos.

O RETVec funciona de forma semelhante aos modelos de aprendizado de máquina do TensorFlow, que usam similaridade visual para determinar o significado das palavras em vez de seu conteúdo literal. Essa abordagem levou a grandes melhorias. O Google afirma que a substituição do classificador de spam do Gmail pelo RETVec melhorou as taxas de detecção de spam em 38% em relação à linha de base e reduziu os falsos positivos em 19,4%. O uso do RETVec reduziu o consumo de TPU do modelo em 83%, tornando a implementação do RETVec uma das maiores atualizações dos últimos anos. A empresa vem testando o RETVec internamente há um ano e o disponibilizou para todas as contas do Gmail dos usuários.



Link da fonte

Comentário (0)

No data
No data

No mesmo tópico

Na mesma categoria

O preço de 100.000 VND por tigela do Pho "voador" causa polêmica, mas o restaurante continua lotado de clientes.
Lindo nascer do sol sobre o mar do Vietnã
Viaje para a "Sapa em Miniatura": Mergulhe na beleza majestosa e poética das montanhas e florestas de Binh Lieu.
Cafeteria em Hanói se transforma em um ambiente europeu, com neve artificial, e atrai clientes.

Do mesmo autor

Herança

Figura

Negócios

A escrita tailandesa - a "chave" para abrir o tesouro de conhecimento milenar.

Acontecimentos atuais

Sistema político

Local

Produto