Otra buena herramienta es fslint
:
fslint es un conjunto de herramientas para encontrar varios problemas con los sistemas de archivos, incluidos archivos duplicados y nombres de archivos problemáticos, etc.
Las herramientas de línea de comandos individuales están disponibles además de la GUI y para acceder a ellas, se puede cambiar o agregar a $ PATH el directorio / usr / share / fslint / fslint en una instalación estándar. Cada uno de estos comandos en ese directorio tiene una opción --help que detalla más sus parámetros.
findup - find DUPlicate files
En sistemas basados en Debian, puede instalarlo con:
sudo apt-get install fslint
También puede hacerlo manualmente si no desea o no puede instalar herramientas de terceros. La mayoría de los programas funcionan calculando sumas de comprobación de archivos . Los archivos con el mismo md5sum casi seguramente contienen exactamente los mismos datos. Entonces, podrías hacer algo como esto:
find / -type f -exec md5sum {} \; > md5sums
gawk '{print $1}' md5sums | sort | uniq -d > dupes
while read d; do echo "---"; grep $d md5sums | cut -d ' ' -f 2-; done < dupes
Salida de muestra (los nombres de archivo en este ejemplo son los mismos, pero también funcionarán cuando sean diferentes):
$ while read d; do echo "---"; grep $d md5sums | cut -d ' ' -f 2-; done < dupes
---
/usr/src/linux-headers-3.2.0-3-common/include/linux/if_bonding.h
/usr/src/linux-headers-3.2.0-4-common/include/linux/if_bonding.h
---
/usr/src/linux-headers-3.2.0-3-common/include/linux/route.h
/usr/src/linux-headers-3.2.0-4-common/include/linux/route.h
---
/usr/src/linux-headers-3.2.0-3-common/include/drm/Kbuild
/usr/src/linux-headers-3.2.0-4-common/include/drm/Kbuild
---
Esto será mucho más lento que las herramientas dedicadas ya mencionadas, pero funcionará.