He realizado algunas investigaciones sobre nagios, opennms y zenoss, pero no estoy seguro de haber encontrado lo que estaba buscando.
La principal fuerza impulsora para mí en este momento es poder monitorear las copias de seguridad. Esto incluye mysql, mssql y, finalmente, algunas copias de seguridad del sistema de archivos.
Tenemos una herramienta que envuelve el proceso de copia de seguridad para estos diferentes sistemas y recopila estadísticas. Entonces, artículos como:
- cantidad de bases de datos respaldadas
- tamaño del archivo de respaldo db
- tamaño del archivo de respaldo db comprimido
- hora de hacer una copia de seguridad
- hora de archivo zip
Quiero poder A) tener notificaciones si los trabajos no se ejecutan de acuerdo con el cronograma B) poder establecer umbrales en las estadísticas que desencadenarían notificaciones C) Quiero poder generar tendencias y graficar las estadísticas
Estoy planeando enviar esta información a la aplicación de monitoreo a través de un POST HTTP. O bien, la aplicación de monitoreo también podría extraerlo de un archivo de registro.
Sin embargo, tendremos otros procesos con otras estáticas "arbitrarias" (desde la perspectiva del sistema de monitoreo) que querrán monitorear y generar tendencias, por lo que la flexibilidad es muy importante.
La herramienta o las herramientas también deberían poder hacer un seguimiento general y tendencias de las interfaces de red, la carga del servidor, etc. Una vez que tengamos implementado el monitoreo de respaldo, también querremos incluir esos elementos.
Gracias.
Seguimiento :
He decidido probar lo siguiente en el orden dado:
- Zabbix: parecía más una "ventanilla única" que las otras y era fácil de instalar en Ubuntu Lucid RC
- opsview
- Nagios w / nagvis, pnp4nagios, nagiosgraph
- cactus con plugin npc
- Munin: un poco asustado de la simplicidad, pero esto puede ser una bendición a largo plazo
Volveré a publicar una vez que haya tomado una decisión, puede pasar un tiempo hasta que eso suceda.