Tenemos un trabajo regular que hace du
resúmenes de una serie de subdirectorios, selecciona a los peores delincuentes y utiliza la salida para determinar si hay cosas que están aumentando rápidamente para detectar posibles problemas. Usamos diff
contra las instantáneas para compararlas.
Hay un directorio de nivel superior, con un número (unos cientos) de subdirectorios, cada uno de los cuales puede contener 10's de miles de archivos cada uno (o más).
Un " du -s
" en este contexto puede ser muy agresivo con IO, haciendo que nuestro servidor saque su caché y luego picos masivos de IO que son un efecto secundario muy desagradable.
¿Qué estrategia se puede usar para obtener los mismos datos, sin los efectos secundarios no deseados?