Últimamente, he estado enfrentando algún tiempo de inactividad en algunos de los sitios de Drupal que he implementado. Me gustaría abordar el problema de forma proactiva, en lugar de reaccionar a esos tiempos de inactividad reiniciando los servicios o el servidor en sí. He leído sobre herramientas de monitoreo como nagios, munin, cacti, etc. para monitorear la salud de su servidor / infraestructura, pero realmente no he probado una en producción. Trato con Drupal casi el 99% de las veces, y me gustaría encontrar sugerencias para la supervisión de nivel de servidor y la supervisión de nivel de Drupal (código de aplicación).
Básicamente, me gustaría recibir una notificación cuando la carga del servidor sea alta, posiblemente señalando al culpable (o la víctima), para que pueda tomar decisiones informadas. También me gustaría saber qué utilizan las personas para el monitoreo de nivel de Drupal (como el correo electrónico) cuando hay un error / advertencia de PHP. (¿Qué sucede cuando el servidor de correo electrónico está inactivo?)