He ejecutado sistemas de archivos XFS como particiones de datos / crecimiento durante casi 10 años en varios servidores Linux.
He notado un fenómeno extraño con los recientes servidores CentOS / RHEL que ejecutan la versión 6.2+.
El uso estable del sistema de archivos se volvió muy variable después del cambio a la revisión más reciente del sistema operativo de EL6.0 y EL6.1. Los sistemas instalados inicialmente con EL6.2 + exhiben el mismo comportamiento; mostrando cambios bruscos en la utilización del disco en las particiones XFS (consulte la línea azul en el gráfico a continuación).
Antes y después de. La actualización de 6.1 a 6.2 ocurrió el sábado.
Gráfico de uso del disco del último trimestre del mismo sistema, que muestra las fluctuaciones de la última semana.
Comencé a verificar los sistemas de archivos para archivos grandes y procesos fuera de control (¿archivos de registro, tal vez?). Descubrí que mis archivos más grandes informaban valores diferentes de du
y ls
. Correr du
con y sin el --apparent-size
interruptor ilustra la diferencia.
# du -skh SOD0005.TXT
29G SOD0005.TXT
# du -skh --apparent-size SOD0005.TXT
21G SOD0005.TXT
Una comprobación rápida con la utilidad ncdu en todo el sistema de archivos arrojó:
Total disk usage: 436.8GiB Apparent size: 365.2GiB Items: 863258
¡El sistema de archivos está lleno de archivos dispersos , con casi 70 GB de espacio perdido en comparación con la versión anterior del sistema operativo / kernel!
Revisé el Bugzilla de Red Hat y cambié los registros para ver si había informes del mismo comportamiento o nuevos anuncios con respecto a XFS.
Nada
Pasé de la versión del kernel 2.6.32-131.17.1.el6 a 2.6.32-220.23.1.el6 durante la actualización; sin cambios en el número de versión menor.
Verifiqué la fragmentación de archivos con la filefrag
herramienta. Algunos de los archivos más grandes en la partición XFS tenían miles de extensiones. La ejecución de la desfragmentación en línea xfs_fsr -v
durante un período lento de actividad ayudó a reducir el uso del disco temporalmente (consulte el miércoles en el primer gráfico anterior). Sin embargo, el uso se disparó tan pronto como se reanudó la actividad del sistema.
¿Que está sucediendo aquí?