Las computadoras son mucho mejores que yo en el análisis de datos. Personalmente prefiero sistemas como OpsView que digieren situaciones y ofrecen una interfaz multifacética. Las estadísticas de monitoreo se filtran por condiciones anormales, y se envían alertas individuales a los administradores responsables del sistema. Hay un panel general de salud que puede ver el servicio de asistencia y la administración que da una idea de cuán grave es un corte y si alguien que pueda solucionarlo está trabajando en ello. Lo ponen en rotación en la pantalla grande como algo que puedes ver de un vistazo, no como algo que miras todo el día. El texto desplazable y las luces intermitentes no son la forma en que los empleados asalariados deberían interactuar con sus sistemas de monitoreo.
Conrad Albrecht-Buehler tiene un Google Techtalk ("Hacer que la supervisión apesta menos") que discute los méritos y las deficiencias que ve en el diseño actual de la interfaz de usuario del tablero, y propone algunas mejoras. No sé si ha publicado código o incluso su tesis. La idea general es simple:
- Define la supervisión de la situación como la captura de un conjunto de señales sobre un estado. Cargue, libere espacio en disco, tráfico de red o incluso cosas de nivel superior, como publicaciones en foros por hora.
- Luego, defina una función de atención que asigne la señal de entrada amplia de 0 a 1, donde 0 es "ignorar" y 1 es "zomg!". En términos de Nagios, reemplaza el estado WARNING por un número entero WARNING.
- Finalmente, define un agregador para resumir y priorizar esas señales de ADVERTENCIA.
En cuanto a las herramientas específicas que usaría para escribir su propio sistema de monitoreo, los scripts de Nagios tienen una interfaz decente (probablemente aquí es donde pegaría un mapeo HEED si lo desea), el almacenamiento de señales se puede hacer con rrdtool , y puedes generar gráficos a partir de eso, y hay una aplicación de Django llamada Graphite que procesa bases de datos rrd. También está Nagvis :
NagVis es un complemento de visualización para el conocido sistema de gestión de red Nagios.
NagVis se puede utilizar para visualizar datos de Nagios, por ejemplo, para mostrar procesos de TI como un sistema de correo o una infraestructura de red.