De una pequeña experiencia reciente con Sensu y un poco de experiencia con Nagios, diría que ambas son excelentes opciones.
Sensu es definitivamente el nuevo chico. Tiene una buena interfaz de usuario y buena API. Sin embargo, requiere Redis y RabbitMQ en su configuración para funcionar. Así que considere si, por lo tanto, desea algo para monitorear esas dependencias fuera de la pila de monitoreo de sensu. Sonian proporciona recetas de chef para probarlo también.
https://github.com/sensu/sensu-chef
Nagios ha estado alrededor por un tiempo terriblemente largo. En general, está empaquetado para la mayoría de las distribuciones, lo que simplifica la instalación y tiene pocas dependencias. Su historial también significa que encontrar personas que lo conozcan o lo hayan utilizado y puedan ofrecer consejos es fácil. Por otro lado, la interfaz de usuario es fea y el acceso a programas es a menudo malicioso o a través de complementos de terceros. platos de autor, también existen para Nagios:
https://github.com/bryanwb/chef-nagios
Si tiene tiempo que iba a tratar tanto, hay poco daño en tener dos sistemas de monitorización que se ejecuta como un ensayo. El principal objetivo para enfocarse, especialmente en una configuración dinámica de EC2, es la facilidad con la que su herramienta de administración de configuración puede generar los archivos de configuración de monitoreo.
En términos de otras herramientas, personalmente incluiría algo para registrar datos de series temporales, por ejemplo, solicitudes por segundo o carga con el tiempo. Los gráficos son de gran ayuda para el monitoreo y se pueden usar para generar alertas a través de Nagios o similar. Personalmente soy fan de Ganglia y Graphite, mientras que Librato Metrics (https://metrics.librato.com/) es una opción no gratuita muy agradable.
¿Has probado con www.clowder.io? Siento que es mejor que cualquiera de los dos. – keithhackbarth
¿Hay alguna instancia de demostración accesible a través de la web de Sensu? Quiero tener una idea sin tener que pasar horas y horas implementándola. – sorin