<$BlogRSDUrl$>

segunda-feira, dezembro 8

A praga 

A minha caixa de mail está ridícula e lembra-me os Monty Python: spam spam spam egg and spam; spam spam spam spam spam spam baked beans spam spam spam...

Felizmente tenho um filtro anti-spam que faz com que certas mensagens apareçam com o título ***SPAM*** e assim possam ser apagadas automaticamente. Só que... prefiro não automatizar nada, pois sei que algumas dessas mensagens não são spam (por exemplo, algumas são comentários da Aba...).

Mesmo com o filtro, continuo a receber dezenas de spam por semana, que me fazem perder demasiado tempo. Quando vim de férias, em Agosto, demorei horas a verificar as mensagens uma a uma para apagar o lixo. Perde-se logo a vontade de trabalhar...

O pior é que o spam está numa fase de “boom”: cada vez mais melgas descobrem-no como forma barata e simples de publicitar um produto: enviar milhões de mails custa a uma empresa umas poucas centenas de euros. Arranjar os endereços de milhões de pessoas é fácil, os fornecedores também anunciam por spam. E assim as fontes de spam vão-se multiplicando: se inicialmente a maior parte do spam era sobre Viagra, “Enlarge your penis”, “Mortgages” ou “loans”, nestas últimas semanas ele diversificou-se bastante, o que é mau sinal.

Vi este exemplo na IEEE Spectrum de Agosto: se um spammer gastar 2000 euros para enviar 20 milhões de mensagens para vender um produto que custa 60, basta que venda 34 unidades para começar a ter lucro. Ou seja, basta ter uma taxa de resposta de 0.00017%, o que é irrisório quando comparado com os 1.5-2% das campanhas de marketing directo via correio convencional (4 ordens de magnitude acima...). O spam é assim o grande negócio do momento e está em grande crescimento. No entanto, floresce à custa de uma enorme perda de produtividade.

Segundo a mesma revista, só a AOL e a MSN filtram cada uma mais de dois milhares de milhões (2 000 000 000) de spams enviados por dia para os seus clientes. Se se conseguir filtrar 95% do spam, mesmo assim passam muitas dezenas de milhares de milhões! E se o filtro se enganar em 1% das vezes, assumindo que uma mensagem é spam quando não é (falsos positivos), então significa que se perdem 20 milhões de mails úteis por dia, o que não é admissível (ninguém gostaria de perder aquele mail com uma oferta de emprego irrecusável…). Assim, os filtros usados correntemente estão afinados para deixar passar bastante spam, procurando minimizar os falsos positivos, ou seja, não fazem o seu trabalho muito bem.

Concluindo: estamos tramados? Ou será que os filtros bayesianos podem ajudar? [voltarei ao assunto...]

Comments: Enviar um comentário
This page is powered by Blogger. Isn't yours? Weblog Commenting by HaloScan.com