Usamos grafito para rastrear el historial de utilización del disco a lo largo del tiempo. Nuestro sistema de alerta analiza los datos del grafito para alertarnos cuando el espacio libre cae por debajo de un cierto número de bloques.
Me gustaría recibir alertas más inteligentes: lo que realmente me importa es "¿cuánto tiempo tengo antes de tener que hacer algo sobre el espacio libre?", Por ejemplo, si la tendencia muestra que en 7 días me quedaré sin disco espacio, luego genera una Advertencia, si son menos de 2 días, genera un Error.
La interfaz de tablero estándar de Graphite puede ser bastante inteligente con derivados y bandas de confianza de Holt Winters, pero hasta ahora no he encontrado una manera de convertir esto en métricas accionables. También estoy de acuerdo con agrupar los números de otras maneras (solo extraiga los números sin procesar del grafito y ejecute un script para hacerlo).
Una complicación es que el gráfico no es uniforme: los archivos se agregan y eliminan, pero la tendencia general a lo largo del tiempo es que aumente el uso del espacio en disco, por lo que tal vez sea necesario observar los mínimos locales (si se observa la métrica "sin disco" ) y dibuja una tendencia entre los canales.
¿Alguien ha hecho esto?
The volume of crap people have to store will expand to fill the disk available.
- Old Sysadmin Axiom