Fondo :
Intenté recuperar datos de un HDD que falla utilizando ddrescue en un entorno Knoppix reciente. Al principio almacené el resultado en una partición NTFS, pero en algún momento la velocidad de copiado se volvió muy lenta (~ 600 KB / s), y leí en alguna guía francesa para esa herramienta que no se recomendaba la recuperación a NTFS, especialmente para un gran volumen, ya que se había informado que provocaría una desaceleración importante. Luego cambié a ext4 y el rendimiento pareció mejorar significativamente. (Ver esta pregunta )
Noté que el "tamaño en el disco" para los archivos de imagen de salida generados por ddrescue era mucho menor que su tamaño real, lo que significa que ddrescue de alguna manera solo asigna los datos que se han leído con éxito de la entrada, lo que resulta en una salida "parcialmente dispersa" , incluso cuando el modificador -S ("escrituras dispersas") no se utiliza. En este caso, el uso del modificador -S da como resultado que los sectores vacíos que en realidad se leen desde la entrada, también no estén asignados en la salida, lo que lo hace "completamente" escaso. (Vea esa otra pregunta ).
Pregunta:
¿Cómo podría explicarse esta brecha de rendimiento entre NTFS y ext4? ¿Está realmente relacionado con la escasez? ¿Se sabe que el controlador NTFS de Linux tiene problemas para manejar archivos dispersos grandes?