Tengo algunas máquinas virtuales en Windows Azure que ejecutan nuestro sitio web de comercio electrónico, y últimamente comenzamos a usar Telegraf, InfluxDb y Grafana para vigilar estas máquinas. Después de un par de semanas de recopilación de datos, noté un patrón extraño relacionado con la métrica Memoria disponible :
Todos los días, casi siempre en el mismo período del día, he notado que se libera una cantidad abrupta de memoria que, debido a mis habilidades muy muy limitadas de DevOp, no puedo entender qué está causando esto.
Aquí hay un cuadro que muestra este patrón:
Mi pregunta es: ¿Qué podría conducir a algo como esto? Me siento tentado a sospechar que la culpa es de una fuga de memoria, pero ... ¡La memoria libre nunca cae por debajo del 70% y solo ocurre en dos de las máquinas virtuales con más tráfico!
¿Debería preocuparme cuando veo algo como esto?
PD: Me he planteado recopilar métricas para bytes privados e virtuales para cada uno de los servicios de Windows que ejecutamos y para el proceso w3wp ... aunque he leído que estas métricas no son muy confiables para averiguar si tiene una pérdida de memoria, pero al menos intentaré obtener algún tipo de tendencia y ver si se correlaciona con el patrón que se muestra arriba.