Al instalar munin, activa un conjunto predeterminado de complementos (al menos en ubuntu). Alternativamente, puede simplemente ejecutar munin-node-configure
para averiguar qué complementos son compatibles con su sistema. La mayoría de estos complementos trazan datos directos. Mi pregunta no es explicar la naturaleza de los datos (bueno ... tal vez para algunos), pero ¿qué es lo que buscas en estos gráficos?
Es fácil instalar munin y ver gráficos elegantes. Pero tener los gráficos y no poder "leerlos" los hace totalmente inútiles.
Voy a enumerar complementos estándar que están habilitados por defecto en mi sistema. Entonces será una larga lista. Para completar, también voy a enumerar complementos que creo entender y dar una breve explicación de para qué creo que se usa. Motivos correctos si estoy equivocado con alguno de ellos.
Entonces déjenme dividir estas preguntas en tres partes:
- Complementos donde ni siquiera entiendo los datos
- Complementos donde entiendo los datos pero no sé a qué debo estar atento
- Complementos que creo entender
Complementos donde ni siquiera entiendo los datos
Estos pueden contener preguntas que no necesariamente están dirigidas a munin solo. No entender los datos generalmente significa una brecha en el conocimiento fundamental sobre sistemas operativos / hardware ...;) No dude en responder con una respuesta "giyf".
Estos son complementos en los que solo puedo adivinar lo que está pasando ... apenas quiero mirar estos "adivinanzas" ...
- Disco IOs por dispositivo (IOs / segundo)
¿Qué es un IO? Sé que significa entrada / salida. Pero eso es todo lo que va. - Latencia de disco por dispositivo (espera de E / S promedio)
No tengo ni idea de qué es una "espera de E / S" ... - IO Service Time
Este es un gran desastre, y es casi imposible ver algo en el gráfico.
Complementos donde entiendo los datos pero no sé a qué debo estar atento
- IOStat (bloques / segundo leído / escrito)
Supongo que lo que hay que tener en cuenta aquí son los picos. ¿Qué significaría que el dispositivo está en uso pesado? - Entropía disponible (bytes)
¿Asumo que esto es importante para la generación de números aleatorios? ¿Por qué graficaría esto? Hasta ahora, el valor siempre ha sido casi constante. - VMStat (ejecución / procesos de suspensión de E / S)
¿Cuál es la diferencia entre este y el gráfico de "procesos"? Ambos muestran procesos en ejecución / inactivos, mientras que el gráfico "Procesos" parece tener más detalles. - Rendimiento de disco por dispositivo (bytes / segundo leído / escrito)
¿Cuál es la diferencia entre este y el gráfico "IOStat"? - uso de la tabla de inodo
¿Qué debo buscar en este gráfico?
Complementos que creo entender
Adivinaré algunas cosas aquí ... corrígeme si me equivoco.
- Uso del disco en porcentaje (porcentaje)
Cuánto espacio en disco se usa / queda. Como esto se acerca al 100%, debe considerar limpiar o extender la partición. Esto es extremadamente importante para la partición raíz. - Rendimiento del cortafuegos (paquetes / segundo)
El número de paquetes que pasan por el cortafuegos. Si esto aumenta durante un período de tiempo más largo, podría ser un signo de un ataque de DOS (o simplemente estamos recibiendo un archivo grande). También puede darle una idea sobre el rendimiento de su firewall. Si se está nivelando y necesita más "potencia", debería considerar el equilibrio de carga. Si se está nivelando y ve una correlación con la carga de su CPU, también podría significar que su hardware no es lo suficientemente rápido. Las correlaciones con el uso del disco podrían apuntar a objetivos LOG excesivos en su configuración de FW. - Errores eth0 (paquetes de entrada / salida)
Errores de red. Si este valor aumenta, podría ser un signo de hardware defectuoso. - tráfico eth0 (bits / segundo de entrada / salida)
Tráfico de red sin formato. Esto debería correlacionarse con el rendimiento del firewall. - número de subprocesos
Un valor cada vez mayor puede indicar que un proceso no cierra correctamente los subprocesos. ¡Investigar! - Procesos
Desglose de los procesos activos (incluido el sueño). Un pico rápido aquí podría apuntar a una bomba tenedor. Un valor lento, pero cada vez mayor, puede apuntar a una aplicación que genera subprocesos pero que no los cierra correctamente. Investigar usandops faux
. - prioridad del proceso
Esto muestra la distribución de las prioridades del proceso. Tener solo procesos de alta prioridad no es de mucha utilidad. Considere eliminar la prioridad de algunos. - uso de la CPU
Bastante sencillo. Si esto está aumentando, es posible que tenga un ataque en curso o que un proceso esté acaparando la CPU. Si aumenta lentamente y se acerca al máximo en las operaciones normales, debería considerar actualizar su hardware (o equilibrio de carga). - uso de la tabla de archivos
Número de archivos abiertos activamente. Si esto alcanza el máximo, es posible que tenga un proceso de apertura, pero no la liberación adecuada de los archivos. - promedio de carga
Muestra un valor resumido para la carga del sistema. Debe correlacionarse con el uso de la CPU. Los valores crecientes pueden provenir de varias fuentes. Busca correlaciones con otros gráficos. - uso de memoria
Una representación gráfica de su memoria. Siempre que tenga muchos buffers + caché + no utilizados, estará bien. - swap in / out
Muestra la actividad en su partición de intercambio. Esto siempre debe ser 0. Si ve actividad en esto, ¡debería agregar más memoria a su máquina!