2010-12-22 23 views
5

¿Cuál es el mejor método actualmente para detectar correo no deseado? especialmente en el mensaje de texto móvil. ¿hay algún recurso o análisis de comparación?Actualmente el mejor algoritmo de filtro de spam

+3

¿Estás preguntando desde la perspectiva de un programador o usuario? Es decir, ¿desea implementar un algoritmo de detección de spam o desea detectar correo no deseado en su propio correo electrónico? – marcog

+0

Pregunto desde la perspectiva de los programadores o del investigador. Estoy tratando de implementar un filtro de spam, pero actualmente estoy mal informado sobre los algoritmos – ahmy

Respuesta

8

Es bueno mirar en las técnicas de aprendizaje supervisado. Ha habido una serie de estudios en los que se ha utilizado el clasificador multinomial Naive Bayes para el filtrado de correo no deseado con mucho éxito. Si funcionó para el filtrado de correo no deseado, entonces debería funcionar con el filtrado de SMS. Lo que necesita es un gran conjunto de datos de textos SMS de spam y entrene al clasificador con él.

Además, puede ser útil buscar en la Máquina de Vector de Soporte, que; aunque menos utilizado en el filtrado de spam; es una técnica mucho más poderosa.

Además, el entrenamiento de los algoritmos en texto sin formato puede no ser el mejor camino a seguir. Hubo un estudio de Mehran Sahami de 1998 que encontró que lograron un rendimiento superior cuando tomaron en cuenta otros heurísticos (por ejemplo, ¿se envió el correo electrónico a una lista de correo?) Era el correo electrónico enviado desde un nombre de dominio que terminaba en ".edu" , ". com", ". org", ¿contenía el correo electrónico múltiples signos de puntuación ("!!!"), etc.?

Pero comienza con el Clasificador de Naes Bayes Multinomial. Es muy simple de implementar, y es muy fácil de usar, y de experiencia personal: también tiene un tiempo de entrenamiento muy corto.

4

Según entiendo, el filtro de spam más moderno es una combinación de una implementación de Bayes' theorem y algunas heurísticas, p. Ej. listas negras del remitente, cumplimiento de estándares, patrones de envío.

El lugar más fácil para implementar esto en la red de telefonía móvil sería probablemente en el SMS message centre, ya que el volumen es más alto, lo que hace que la heurística sea más fácil de implementar.

0

Utilizar una amplia variedad de algoritmos y heurística (y no "el" mejor método) es una buena forma de proteger su red y sus suscriptores del correo no deseado, fraude, contenido malicioso, acoso cibernético, robo de identidad, virus, etc.

Cloudmark y sus varios socios y la competencia es un buen lugar para empezar a buscar.

-1

¿Por qué necesita para detectar el spam post-factum, prevent it in the trasero ... otra vez, int la yema ...

Actualización:
Los filtros se utilizan amplia y fácilmente por blackhat SEO/SEM y criminales para poner en la lista negra/arrojar competidores.
Además, ellos tienen carácter retroactivo, por lo tanto, siempre condenado a la zaga de las técnicas de los spammers avances

+0

Es porque estoy desarrollando un dispositivo móvil cliente de aplicaciones – ahmy

Cuestiones relacionadas