Recientemente obtuve acceso a una gran cantidad de datos de registro del servidor (en el nuevo trabajo). Tengo cierta experiencia en aprendizaje automático de la universidad. Los datos de los registros incluyen registros del servidor, registros de acceso a la base de datos, etc. Me preguntaba qué tipo de aprendizaje se puede hacer a partir de dichos datos.Machine Learning en los datos de registro del servidor
Una pequeña cosa que intenté fue predecir el número de solicitudes en una determinada hora del día en función de los datos de la semana pasada, lo que parecía correcto, pero esto es algo trivial. Entonces,
- ¿Qué tipo de aprendizaje se puede hacer con estos datos?
- ¿Puede predecir la probabilidad de que un IP haga clic en los anuncios no deseados (sí, la compañía se dedica a eso) en función de algún patrón de uso de spammers anteriores?
- Puede estar prediciendo a qué hora puede dispararse el tráfico.
- ¿Existen herramientas/proyectos existentes que aprovechen específicamente?
- ¿Algún recurso/documento interesante que habla de cosas similares?
- Además, la actividad de proceso relacionada con los datos en un tiempo determinado en el servidor. ¿Puede ser útil para aprender?
gracias! le echaré un vistazo – swair