Soluciones gráficas de Nagios vs Munin / Cacti / Ganglia


9

Tengo una configuración de servidor nagios para monitorear ~ 30 servidores de Windows. Quiero agregar algunos gráficos de tendencias. He leído que los complementos de gráficos de nagios son simples y muchas personas usan herramientas de gráficos / tendencias independientes y separadas.

¿Cuáles son las restricciones de los complementos de gráficos de nagios frente a productos independientes como ganglia / munin / cacti?

Estoy interesado en las características y ventajas específicas que ofrecen los paquetes independientes y los complementos de gráficos nagios no.


También debe considerar Zabbix ... serverfault.com/q/109595/2039
sebthebert

Prueba opsview community edition, basado en nagios. Puede instalar en diferentes sabores de Linux o descargar VM. opsview.com/downloads/download-opsview-community
Matias Dominoni

Para el registro: he probado nagiosgraph y luego me quedé con él. Estoy bastante contento con lo que ofrece
sumek

Respuestas:


7

dado que ya tiene una instalación de nagios, considere nagiosgraph o pnp4nagios.

nagiosgraph y pnp4nagios hacen un buen trabajo al trazar datos de rendimiento de nagios. nagiosgraph tiene un enfoque de configuración basado en parámetros, pnp4nagios tiene un enfoque basado en plantillas.

  • ambos detectan automáticamente nuevos hosts / servicios cada vez que cambia la configuración de nagios
  • ambos hacen zoom gráfico
  • ambos proporcionan gráficos al pasar el mouse sobre hosts / servicios específicos
  • ambos proporcionan muchas formas de cortar y cortar sus datos
  • ambos detectan y grafican los niveles críticos y de advertencia que ya ha definido en nagios
  • ambos pueden integrarse directamente en el marco de nagios para una navegación fluida y ordenada desde el estado actual al historial y viceversa

Cortar y cortar en cubitos los datos es bastante importante, en mi humilde opinión. por ejemplo, puede ver todos los servicios en un solo host, o ver todos los hosts con un servicio específico, o ver colecciones arbitrarias de gráficos para hosts y servicios arbitrarios.

La instalación no es trivial, pero no es difícil. mucho depende de cuánto quieras personalizar las cosas. por ejemplo, nagiosgraph es 'install.pl' o 'rpm -i nagiosgraph.rpm' o 'dpkg -i nagiosgraph.deb'. pnp4nagios es './configure; hacer; hacer instalar '.

n2rrd también puede hacer algunas de estas cosas, pero no está tan pulido y requiere más trabajo para configurarlo.

rrdtool tiene peculiaridades de almacenamiento de datos wrt, y cualquier sistema tendrá problemas de muestreo. rrdtool suaviza algunos datos de forma predeterminada, pero puede capturar (y graficar) máximos y / o mínimos además de los promedios si es necesario.

cada enfoque basado en rrdtool sufre de obsolescencia de datos / gráficos ya que el esquema en cada archivo rrd es estático y la mayoría de los sistemas usan el nombre de archivo rrd para identificar los datos. los datos generalmente nunca se pierden cuando cambia un nombre de host o de servicio; los archivos rrd todavía existen en el disco. pero algunas interfaces de usuario proporcionan formas de ver archivos rrd 'obsoletos', otras requieren mantenimiento manual a través de la línea de comandos. En muchas instalaciones, esto es solo un problema cuando se configura inicialmente el sistema, pero en entornos dinámicos (por ejemplo, monitoreo de máquinas virtuales cuya vida útil es solo unos pocos meses) puede volverse tedioso.

Una nota final. En realidad, hay dos partes en las tendencias: recopilación de datos y visualización de datos. Si utiliza un sistema de gráficos independiente en lugar de ampliar la instalación existente de Nagios, es posible que deba instalar componentes adicionales en sus máquinas Windows para recopilar los datos.


13

Estoy de acuerdo con Lynxman. NAGIOS es para datos cualitativos inmediatos (¿X está bien o no?); munin es para datos cuantitativos históricos (¿qué tan lleno está X ahora y qué tan lleno ha estado este año?). Todas mis instalaciones de NAGIOS, algunas de las cuales monitorean varios cientos de servicios, están vinculadas a sistemas munin para realizar el monitoreo cuantitativo.

Tenga en cuenta también que munin tiene ganchos específicos para alimentar datos a NAGIOS. Entiende el concepto de umbrales de ADVERTENCIA y CRÍTICOS, y donde se requiere notificación (y una vista en la "placa grande" de NAGIOS) es muy fácil tener una sola variable de munin que informe el estado de un solo servicio de NAGIOS.

El flujo de trabajo habitual es que nadie mira los gráficos de munin hasta que NAGIOS advierte que se ha incumplido un umbral, pero luego los gráficos de munin se vuelven invaluables para descubrir si algo se ha ido incrementando lentamente con el tiempo, o esto es algo fuera de lo común. -aumentar azul, o tenemos un ciclo semanal hacia arriba y hacia abajo que aumenta lentamente en amplitud, o qué.

Como dice Lynxman, la forma UNIX es "una tarea, una herramienta". Hacer una cadena de herramientas de munin y NAGIOS funciona muy bien para mí para proporcionar monitoreo cuantitativo y cualitativo, así como notificaciones. También tiene la clara ventaja de mantener limpias las interfaces: cuando observa NAGIOS, ve una vista simple de qué tan bien están funcionando las cosas en este momento , sin datos históricos que abarroten la vista; cuando mira munin, ve información histórica pertinente al problema lista para su análisis, sin que los errores "host no funcionen" o "sshd no me hable" abarrotan la vista.


3

Los complementos de gráficos de Nagios, como usted dice, son muy restringidos, ofrecen una interfaz rrdtool muy básica y el diseño de la interfaz de usuario es un poco intuitivo, básicamente es un truco sobre nagios, traté de usarlo solo por diversión, pero se rompió varias veces sin previo aviso.

Optar por un producto independiente (especialmente munin o ganglia) le ofrece una gran variedad de servicios que Nagios no puede lograr, ya que el mantra de Unix es mejor ser bueno en una sola cosa que tratar de ser bueno en muchos, Nagios es increíble para El monitoreo y munin / ganglia / cacti son sorprendentes en la representación gráfica.


Entonces, ¿qué hay dentro de esta gran variedad de servicios que Nagios no puede lograr ? Esto es lo que me interesa.
sumek

Con nagios es muy fácil perder sus datos gráficos, también es muy fácil para el complemento dejar de graficar datos en un momento dado, no le da ninguna posibilidad de acercarse a un tiempo específico (lo que hacen todos los demás), no te da la posibilidad de hacer gráficos agregados complicados, y eso es solo para empezar :)
lynxman

¿Qué quiere decir con fácil perder sus datos gráficos ? Un rápido google muestra que las 5 soluciones mencionadas (ganglios, munin, cactus, pnpgraph, nagiosgraph) usan rrdtool para almacenar datos de gráficos.
sumek

Sí, sumek, a lo que me refiero es que nuevamente la herramienta de gráficos en nagios es un truco, y cada vez que haya una falta de coincidencia entre el nombre del archivo rrd y la información del gráfico se romperá, si quieres probarlo, sufre el dolor como yo hizo y luego pasar a una solución real como munin :)
lynxman

2

En Stack Overflow usamos n2rrd, que es un complemento de Nagios para graficar datos de rendimiento. Hasta cierto punto, estaría de acuerdo con Lynxman en que tiene una gran sensación de hack.

Sin embargo:

  • Con n2rrd puedes hacer que Cacti haga la gráfica basada en los datos en lugar del rrd2graph.cgi que viene con n2rrd
  • n2rrd con rrd2graph.cgi admite el zoom
  • En cuanto a los gráficos agregados complicados, básicamente manipulas los gráficos rrd a mano y puedes hacer lo que quieras con ellos.

Los gráficos rrd se almacenan de acuerdo con los nombres del servidor, por lo que si cambia el nombre de algo, pierde los datos ... Siempre puede cambiar el nombre de los archivos y vincularlos y no perderá los datos.

Tengo algunos ejemplos de estos gráficos en mi reciente publicación en el blog Algunos consejos para mejorar RRD Graphs Server Fault. Además, la página n2rrd incluye tanto la demostración de cactus como rrd2graph.

Creo que la conclusión es que la ruta de Nagios puede faltar en una o dos características, pero es bastante completa si no te importa ensuciarte las manos con los detalles de escribir plantillas rrd *. Probablemente le tomará más tiempo, pero lo alentará a desarrollar más experiencia en rrd.


1
* [error de nota al pie sin referencia]: ¿qué ibas a agregar allí, kyle; mentes inquisitivas necesitan saber!
MadHatter

0

Exijo datos precisos y la visualización de datos de rrd no es precisa, ¡está normalizada! Para la mayoría de los usuarios, esto está bien porque, para empezar, no están utilizando datos muy precisos. Están utilizando datos cuyas frecuencias de muestreo suelen ser de un minuto o más y eso no le dará una descripción muy precisa de lo que está sucediendo. Esto también significa que si tiene un pico en sus datos en algún lugar, es posible que nunca lo vea.

Considere esto: supongamos que su red Gb está funcionando a unos 10 MB / seg y de repente hay un pico de 100 MB / seg durante un par de minutos. También tenga en cuenta que si fue solo un pico de 30 segundos, es posible que ni siquiera lo vea a frecuencias de muestreo de unos minutos. Si observa los datos del día, ese 'pico' solo puede aparecer como 15 MB / seg, aunque el valor real también depende de otros factores. ¡También es muy probable que asumas que tu red es feliz cuando no lo es!

Lo que es aún más frustrante para mí son los datos normalizados al ancho físico del gráfico y el rango del eje x. ¿Lo que esto significa es ese pico que mencioné que no viste? ¡Si haces zoom, aparece mágicamente! Me adheriré a gnuplot: los gráficos pueden no ser tan bonitos pero son sólidos como una roca y gnuplot nunca modifica los datos antes de mostrarlos.

-marca


0

Creo que usar pnp4nagios funciona bastante bien para graficar. Es compatible con el zoom también. No es el más fácil de implementar, pero nada con nagios lo es.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.