¿Cuál es el mejor método actualmente para detectar correo no deseado? especialmente en el mensaje de texto móvil. ¿hay algún recurso o análisis de comparación?Actualmente el mejor algoritmo de filtro de spam
Respuesta
Es bueno mirar en las técnicas de aprendizaje supervisado. Ha habido una serie de estudios en los que se ha utilizado el clasificador multinomial Naive Bayes para el filtrado de correo no deseado con mucho éxito. Si funcionó para el filtrado de correo no deseado, entonces debería funcionar con el filtrado de SMS. Lo que necesita es un gran conjunto de datos de textos SMS de spam y entrene al clasificador con él.
Además, puede ser útil buscar en la Máquina de Vector de Soporte, que; aunque menos utilizado en el filtrado de spam; es una técnica mucho más poderosa.
Además, el entrenamiento de los algoritmos en texto sin formato puede no ser el mejor camino a seguir. Hubo un estudio de Mehran Sahami de 1998 que encontró que lograron un rendimiento superior cuando tomaron en cuenta otros heurísticos (por ejemplo, ¿se envió el correo electrónico a una lista de correo?) Era el correo electrónico enviado desde un nombre de dominio que terminaba en ".edu" , ". com", ". org", ¿contenía el correo electrónico múltiples signos de puntuación ("!!!"), etc.?
Pero comienza con el Clasificador de Naes Bayes Multinomial. Es muy simple de implementar, y es muy fácil de usar, y de experiencia personal: también tiene un tiempo de entrenamiento muy corto.
Según entiendo, el filtro de spam más moderno es una combinación de una implementación de Bayes' theorem y algunas heurísticas, p. Ej. listas negras del remitente, cumplimiento de estándares, patrones de envío.
El lugar más fácil para implementar esto en la red de telefonía móvil sería probablemente en el SMS message centre, ya que el volumen es más alto, lo que hace que la heurística sea más fácil de implementar.
Utilizar una amplia variedad de algoritmos y heurística (y no "el" mejor método) es una buena forma de proteger su red y sus suscriptores del correo no deseado, fraude, contenido malicioso, acoso cibernético, robo de identidad, virus, etc.
Cloudmark y sus varios socios y la competencia es un buen lugar para empezar a buscar.
¿Por qué necesita para detectar el spam post-factum, prevent it in the trasero ... otra vez, int la yema ...
Actualización:
Los filtros se utilizan amplia y fácilmente por blackhat SEO/SEM y criminales para poner en la lista negra/arrojar competidores.
Además, ellos tienen carácter retroactivo, por lo tanto, siempre condenado a la zaga de las técnicas de los spammers avances
Es porque estoy desarrollando un dispositivo móvil cliente de aplicaciones – ahmy
- 1. Filtro Comentario Spam? PHP
- 2. Cómo escribir el filtro de spam
- 3. ¿Cómo funciona el filtro de spam de Gmail?
- 4. ¿Cuál es considerado actualmente el "mejor" algoritmo para la coincidencia de puntos 2D?
- 5. ¿Cuál es actualmente el algoritmo de encriptación unidireccional más seguro?
- 6. Algoritmo de agrupamiento del filtro de precios
- 7. Combinando las probabilidades individuales en el filtro de spam de Naive Bayesian
- 8. ¿El mejor algoritmo de coincidencia difusa?
- 9. ¿Cuál es actualmente el mejor sistema de compilación?
- 10. ¿el mejor algoritmo para el intercambio?
- 11. Cómo funciona el algoritmo del filtro gaussiano en OpenCV
- 12. Detener el spam sin captcha
- 13. 'Mejor' Algoritmo Diff
- 14. El mejor algoritmo para ordenar los exámenes
- 15. El mejor algoritmo para unir colores.
- 16. ¿Es así como paginas, o hay un algoritmo mejor?
- 17. ¿Qué navegador tiene actualmente el mejor soporte para HTML 5?
- 18. ¿Mejor algoritmo de generación/simulación de rayos?
- 19. ¿Cuál es el mejor algoritmo de multiplicación de matrices?
- 20. ¿Cuál es el mejor algoritmo de clasificación de asientos reservados?
- 21. ¿Es A * el mejor algoritmo de determinación de ruta?
- 22. Biblioteca de filtrado de spam bayesiano para Python
- 23. ¿Diseñando este algoritmo de una mejor manera?
- 24. ¿Cuál es actualmente la mejor configuración de HTML/CSS/Javascript?
- 25. Mejor algoritmo para indexar oraciones
- 26. Cálculo de la probabilidad de que un token sea correo no deseado en un filtro de spam bayesiano
- 27. ¿Cuál es el mejor algoritmo de derivación "llave en mano"?
- 28. Algoritmo para obtener el mejor color de texto
- 29. Blackberry code signing spam
- 30. ¿Qué corpus de spam puedo usar en NLTK?
¿Estás preguntando desde la perspectiva de un programador o usuario? Es decir, ¿desea implementar un algoritmo de detección de spam o desea detectar correo no deseado en su propio correo electrónico? – marcog
Pregunto desde la perspectiva de los programadores o del investigador. Estoy tratando de implementar un filtro de spam, pero actualmente estoy mal informado sobre los algoritmos – ahmy