2008-11-17 16 views
7

Estoy atascado en tener que escribir un simple filtro de spam No estoy seguro de cómo voy a hacerlo.Cómo escribir el filtro de spam

Hasta ahora he creado una lista de palabras y filtros de dominio, que darán o eliminarán puntos hasta cierto umbral.

Por ejemplo, si escribe sobre "v1agr4" de un dominio de la lista negra, recibirá 2 puntos como spam, pero si escribe sobre "v1agr4" desde una cuenta de hotmail.com, ' Obtendré solo 1 "punto de spam".

¿Tienen alguna otra sugerencia/recurso?

Esto es más sobre el aprendizaje de los filtros de spam de desarrollar algo empresa de grado

Respuesta

3

Algunos proyectos de código abierto de Java relacionados con Bayesiano de filtrado de spam (que fue mencionado por LFSR Consulting):

Y uno extra para C++:

0

que puede delegar a un servicio distribuido. Akismet es una muy buena solución.

0

Escribir un filtro de spam depende de sus demandas de escalabilidad.

Si desea una solución escalable, el filtrado de contenido probablemente no sea la opción inteligente ya que consume mucho CPU y memoria, y en su lugar preferiría elegir filtrado basado en reputación o filtrado basado en lista negra, que será es mucho más amigable con la CPU en su servidor y mucho más fácil de escribir.

Escribí un a post on my blog que explica la idea detrás de escribir un filtro de correo no deseado desde el punto de vista de un programador y cubre todas las opciones desde el filtrado basado en contenido hasta el filtrado basado en la lista negra.

Cuestiones relacionadas