você está aqui: Home  → Arquivo de Mensagens

Bogofilter - Treinamento

Colaboração: Eduardo Sztokbant

Data de Publicação: 05 de Fevereiro de 2004

O bogofilter pode ser treinado com um script perl que vem com ele chamado 'bogominitrain.pl'. Recomendo a leitura do FAQ do bogofilter pra ver como ele faz (http://bogofilter.sourceforge.net/bogofilter-faq.html)

Em seguida, coloquei no .procmailrc pra ele filtrar usando 3 status (spam, not-spam e unsure) e marcar o status e o indice de spamicidade no cabeçalho do e-mail para depois tomar a decisão. No caso, usei o bogominitrain.pl treinando o bogofilter com >0.7=spam, <0.3=not_spam e entre esses valores marquei como unsure. Na filtragem, diminuí um pouco a margem: >0.65=spam, <0.45=not_spam.

De tempos em tempos pego os raros falsos positivos/negativos, concateno nos meus arquivos de spam/not_spam e rodo novamente o bogominitrain.pl.

Já fiz alguns testes com ele e, neste exato momento, estou rodando-o com 0.9 e 0.3 pra fazer mais testes. O melhor é ir testando até achar uma configuração ideal.

.procmailrc bogofilter session BEGIN

  BOGOFILTER=/usr/bin/bogofilter
  
  :0fw
  | $BOGOFILTER -e -p -o 0.65,0.45 -3
  
  # if bogofilter failed, return the mail to the queue, the MTA will
  # retry to deliver it later
  # 75 is the value for EX_TEMPFAIL in /usr/include/sysexits.h
  :0e
  { EXITCODE=75 HOST }
  
  :0:
  * ^X-Bogosity: Yes, tests=bogofilter
  SPAM/
  .procmailrc bogofilter session END -----

Unicamp: Especialização em Orientação a Objetos

Estão abertas na UNICAMP as inscricoes para o Curso de Especialização em ORIENTACAO A OBJETOS, de um ano e meio de duração, com inicio em 28/FEVEREIRO. O curso aborda tecnologias de bancos de dados, linguagem Java e UML, dentre outras.

INSCRICOES ate 11/02 na Escola de Extensão da UNICAMP ou on-line http://www.extecamp.unicamp.br/dados.asp?sigla=INF-400&of=012

OFERECIMENTO - 28/02/2004 a 28/05/2005 Para mais informacoes, contatar (19) 3289-0109 (http://eoo.ic.unicamp.br)

OUTROS CURSOS: http://www.ahand.unicamp.br/cursos/agenda/agenda.html


Chipsets SiS no Linux

http://www.linuxdicas.com.br/sections-viewarticle-233.html



Veja a relação completa dos artigos de Eduardo Sztokbant

 

 

Opinião dos Leitores

Seja o primeiro a comentar este artigo
*Nome:
Email:
Me notifique sobre novos comentários nessa página
Oculte meu email
*Texto:
 
  Para publicar seu comentário, digite o código contido na imagem acima
 


Powered by Scriptsmill Comments Script