Índice:
Definição - O que significa Filtro Bayesiano?
Um filtro bayesiano é um programa de computador que usa lógica bayesiana ou análise bayesiana, que são termos sinônimos. É usado para avaliar o cabeçalho e o conteúdo das mensagens de e-mail e determinar se constitui ou não spam - e-mail não solicitado ou o equivalente eletrônico de correio em massa ou lixo eletrônico. Um filtro bayesiano é melhor usado junto com programas antivírus.
Techopedia explica o filtro bayesiano
Um filtro bayesiano trabalha com probabilidades de palavras específicas que aparecem no cabeçalho ou no conteúdo de um email. Certas palavras indicam uma alta probabilidade de o email ser spam, como Viagra e refinanciar. O filtro não inicia sabendo a probabilidade de uma palavra indicar uma alta probabilidade de spam. Os usuários devem identificar manualmente o email como spam. Quando são encontradas ocorrências suficientes da palavra e o email é identificado como spam, o filtro bayesiano "aprende" a identificar a palavra usando as funções de probabilidade. Faz o mesmo com muitas outras palavras e frases. Com o tempo, o filtro bayesiano se torna cada vez mais eficaz na identificação de spam para um usuário específico. Quando a probabilidade atinge um determinado limite, como 95%, o email é identificado como spam e frequentemente movido para uma pasta indesejada (ou às vezes até excluída automaticamente). O usuário pode visualizá-lo periodicamente e decidir se deseja excluí-lo ou não. Como alternativa, alguns programas de spam o moverão para um local de quarentena em que os usuários possam visualizar o email e revisar a decisão do software.
O “treinamento” inicial geralmente pode ser refinado para reduzir falsos positivos ou negativos quando julgamentos errados são encontrados. Isso permite que o filtro bayesiano do software se adapte à natureza em constante evolução do spam.
Alguns filtros de spam também usam heurísticas junto com o filtro bayesiano. Regras predefinidas são configuradas pelo usuário para aumentar ainda mais a precisão da identificação de email como spam. Essas regras podem envolver o número de ocorrências de uma determinada palavra, eliminar ou ignorar palavras neutras como "the", "a" ou "some" ou identificar sequências de trabalhos como "Viagra é bom para", em vez de aplicar uma probabilidade função para todas as quatro palavras individuais.
Os spammers podem usar uma técnica chamada envenenamento bayesiano para degradar a eficácia dos filtros de spam usando o filtro bayesiano. Algumas técnicas incluem a injeção de texto legítimo de notícias ou fontes literárias, usando palavras inócuas aleatórias raramente encontradas em spam ou mesmo substituindo texto por figuras.
Muitos clientes de email desabilitam a exibição de imagens por motivos de segurança. Assim, o spam pode alcançar menos destinatários.
Um filtro bayesiano usando lógica bayesiana pode ser usado para classificar qualquer tipo de dados. Medicina, ciência e engenharia todos encontraram usos. Curiosamente, pesquisadores científicos especularam que até o cérebro humano pode usar a metodologia lógica bayesiana para classificar estímulos e determinar comportamentos de resposta específicos.