Mi tío es un fotógrafo con muchísimas sesiones de fotos. Almacenó (duplicados de) copias de seguridad en una variedad de discos duros externos. El 90% de todas las copias de seguridad son iguales, pero algunas han tenido algunas modificaciones, como archivos agregados o imágenes retocadas. Ahora le conseguí un NAS con configuración RAID y un NAS fuera del sitio para realizar copias de seguridad adicionales de la máquina principal, para almacenar todos sus datos en un solo dispositivo. Me pidió que deduplicara todas las copias de seguridad y solo conservara la última versión, eliminando todas las copias.
Ya hay algunas aplicaciones (claro, recomiende una si conoce una (Mac / Windows) para identificar imágenes de copia cuando el tamaño y el nombre del archivo son iguales. Pero me preguntaba ...
TL; DR
¿Cuáles son las probabilidades de que una imagen mantenga el mismo tamaño de archivo cuando se hace photoshop?
//
Alternativamente: ¿Cuál es la mejor manera de identificar duplicados perfectos de imágenes?
En el caso, mi método de trabajo anterior (nombre de archivo / tamaño) no es la mejor manera de hacerlo.
Supuse que si las probabilidades son muy bajas (<1%), simplemente podría buscar y destruir y conservar 1 de cada archivo cuyo nombre y tamaño de archivo sean iguales.