Tenemos 3 servidores dedicados, divididos en varios VPS usando openVZ. Estamos usando munin para monitorear el VPS con los sitios de producción, y monitorear alguno de los VPS para asegurarnos de que reinicie el servicio cuando falla.
La cuestión es que necesitamos una forma mucho mejor de monitorear todos nuestros servidores, ya que tenemos hasta 14 VPS, nos gustaría tener un centro central donde pudiéramos ver no solo los datos recopilados por munin, sino también algunas estadísticas adicionales. en las redes y actuaciones de nuestros servicios.
Algunos de nuestros requisitos:
- Notificación de SMS en caso de falla (posibilidad de configurar cierta verificación personalizada)
- Analizador de registro para apache error_log y algunos otros.
- Debe ser central (es decir, un servidor y varios nodos que recopilan los datos).
- No necesita ser fácil de instalar pero fácil de mantener.
- Necesito ser libre
Me han señalado nagios y splunk, ¿qué te parece? Gracias,