<$BlogRSDUrl$>

sábado, fevereiro 21

A evolução do spam 

A minha caixa de mail é um caldo de letras onde o spam evolui a um ritmo impressionante. Já nem falo dos vírus informáticos, outros que tais. Ambos estão cada vez mais variados e sofisticados, à medida que são filtrados pelas barreiras impostas pelos programas anti-spam e anti-vírus, seus “predadores”, também cada vez mais complexos. Tal como os vírus que passam barreiras entre espécies ou as bactérias resistentes aos antibióticos. Estaremos a assistir a uma espécie de origem da vida cibernética?

Como será o spam do futuro? Sem querer ser exaustivo, tenho vindo a reparar em diferentes fases:

1. No início, o spam chegava sempre dos mesmos endereços, por isso era fácil criar uma blacklist de spammers, cujas mensagens iam automaticamente para o lixo.

2. Isso deixou de funcionar, porque os spammers passaram a usar endereços falsos, dinâmicos, com números e caracteres aleatórios, sempre diferentes.

3. Bem, pelo menos havia a alternativa de enviar mensagens com certas palavras para o lixo (como "penis", "FREE", "porn" ou "loan"). No entanto, essa técnica durou pouco pois agora eles usam "F*R*E*E", "E}{treme" ou "p0rn".

4. Apareceram então programas como o "SPAM assassin" que têm uma lista enorme de regras que ajudam a identificar o spam, regras que vão sendo actualizadas a cada nova versão. Cada regra vale um certo número de pontos consoante o grau de probabilidade de ser spam: por exemplo, se o texto contém "offers" vale 0.2, se há muitos pontos de exclamação no "subject" vale 0.4, etc... Se o número de pontos de uma mensagem for superior a um limiar, marca-se o título da mensagem com *******SPAM******, que é facil de apagar automaticamente.

5. Os spammers reagiram, contornando as regras de filtragem, numa tentativa de escapar à selecção e consequente destruição. Enviam spam só com imagens, sem texto, mas os anti-spammers adicionam um filtro para isso.

6. Neste momento recebo muitos spam parecidos com mensagens normais de mail, escritos como se fosse um mail pessoal, tipo carta, com um mínimo de HTML. As palavras que podem denunciar o spam são escondidas por exemplo usando os processos acima (ponto 3) ou pela técnica do meme das letras trocadas (cuja propagação na rede seguimos aqui na Aba).

7. Surgiram entretanto os filtros Bayesianos, capazes de definir por si as regras de selecção e de se adaptar ao utilizador (o que é spam para mim pode não o ser para outra pessoa). Basta enviar o spam que se recebe para uma pasta especial para o efeito, o conteúdo é analisado pelo programa que aprende a distingui-lo do conteúdo das outras pastas que não são spam. Depois, deixamo-nos de preocupar, o programa aprende: quanto mais spam recebermos, melhor funcionará o filtro (para mais pormenores, ver por exemplo este artigo ou este). O ideal mesmo é usar estes filtros em simultâneo com outras técnicas (blacklists, whitelists, etc), quanto mais barreiras melhor (a legislação também ajuda...).

8. Entretanto, nesta última semana, comecei a receber os mesmos spams repetidos 5 vezes, o que faz com que a sua visibilidade no écran aumente significativamente e eu me irrite cada vez mais.

O spam e o anti-spam continuarão a evoluir, a sofisticar-se e a diversificar-se (ah, a inevitável complexidade...). O spam tenderá a tornar-se cada vez mais parecido com as mensagens não-spam, pois só esse pode passar. O mimetismo, a camuflagem, no fundo a desinformação deverão ser o caminho da sobrevivência do spam. Podemos imaginar que, no limite da evolução, e assumindo que o problema é tecnicamente resolúvel, o único spam que consegue passar os filtros é de tal forma semelhante ao não-spam, que nem mesmo nós o conseguimos distinguir. Mas nessa altura deixaria de ser spam... Ou talvez a mensagem do spam seja sempre diferente de uma não-spam e nesse caso a diferença pode ser explorada pelos anti-spammers... Enfim, tenhamos esperança no desfecho desta luta.

Referências:
[1] - “Saving Private e-mail”, S.J. Vaughan-Nichols, IEEE Spectrum, Agosto 2003
[2] - Cartoon: Stayskal

Comments: Enviar um comentário
This page is powered by Blogger. Isn't yours? Weblog Commenting by HaloScan.com