¿Qué puedo usar para encontrar fotos duplicadas, incluidas las fotos que han sido redimensionadas?
¿Qué puedo usar para encontrar fotos duplicadas, incluidas las fotos que han sido redimensionadas?
Respuestas:
Agrega todas las fotos a tu colección. En el menú, seleccione "Herramientas / Buscar duplicados". Esto buscará duplicados en toda su colección.
Una herramienta de línea de comando. Pase todas las imágenes que desea comparar en la línea de comando.
En el menú, seleccione "Archivo / Buscar duplicado". Arrastre y suelte archivos de imagen en la ventana de duplicados. Puede soltar directorios para agregar sus contenidos de forma recursiva. Para la comparación visual de imágenes, hay opciones específicas no predeterminadas en un menú desplegable. El nivel de similitud "personalizado" permite restringir los emparejamientos solo al más alto grado de similitud, pero debe establecerse en "Preferencias" como 99. Incluso entonces, no funciona perfectamente al menos para algunos tipos de imágenes, como líneas. Arte. Desafortunadamente, no proporciona un mecanismo de selección automática con criterios racionales, como resolución, fecha o lo que sea, la selección automática parece elegir aleatoriamente la primera imagen encontrada como referencia para preservar. Eliminar muchas imágenes puede ser extremadamente lento, ya que intenta actualizar el recuento de resultados en cada eliminación.
Las tres herramientas encuentran duplicados visuales, no solo archivos que son idénticos byte por byte.
fslint
es un programa gráfico que puede encontrar archivos duplicados de cualquier tipo mediante md5sum. Si las imágenes no son idénticas, no se marcarán como duplicados. La imagen a continuación muestra un montón de archivos pdf duplicados en mi directorio de Descargas:
Puede cambiar los parámetros de búsqueda avanzada para buscar por tipo de archivo y restringirse solo a las imágenes. Eso se hace cambiando los "parámetros de búsqueda extra" como find
opciones de comando. Por ejemplo, aquí solo estoy buscando *.jpg
archivos (en la misma ruta, solo mirando mi carpeta "Descargas":
fdupes
es una herramienta equivalente basada en la línea de comandos. Ambos están disponibles en los repositorios.
Puede usar una herramienta de línea de comandos llamada fdupes
para buscar archivos duplicados (consulte man fdupes
para más detalles). No conozco ninguna forma de encontrar 'duplicados' que hayan sido redimensionados. Un programa que hiciera esto requeriría algún tipo de algoritmo inteligente que analizara el contenido de la imagen porque cuando se cambia el tamaño de una imagen, sus datos cambian para que los métodos tradicionales de búsqueda de duplicados no funcionen.
imgSeek puede encontrar duplicados e imágenes similares (por lo que debería poder encontrar fotos redimensionadas y fotos con diferentes nombres de archivo y metadatos) e incluso buscar fotos basadas en un boceto. Está disponible en versiones de escritorio y servidor.
Sin embargo, no lo he probado yo mismo.
isk-daemon
funciona en 12.04, aunque descubrí que tenía que instalar desde la fuente ( pip install
según la página de instalación no funcionaba)
dupeGuru Picture Edition funciona absolutamente genial, y vale la pena intentarlo.
Tienen un PPA Launchpad , dupeguru
( dupeguru-pe
se puede instalar un nuevo paquete todo en uno) o (paquete de edición de imagen anterior) usando esos comandos:
sudo add-apt-repository ppa:hsoft/ppa
sudo apt-get update
sudo apt-get install dupeguru
Visipics es una aplicación gratuita de Windows para esa función, pero funciona muy bien en Linux, a través de wine, por supuesto (es mejor que geeqie / gqview con respecto a la clasificación de los duplicados (los resultados de geeqie son absolutamente "no clasificables")).
Puede indicarle que seleccione automáticamente las imágenes según criterios como tamaño de archivo más pequeño, tipo no comprimido, resolución más baja (sin embargo, no hará lo contrario, necesitaría hacerlo manualmente, lo que no sería mucho mejor que hacerlo en geeqie, excepto que la selección no requiere mantener Shift/ Ctrl), e incluso priorizar carpetas (pero la última prioridad es la prioridad de carpeta).
Sin embargo, debe prestar atención a los enlaces simbólicos: puede seleccionar "aleatoriamente" guardar un enlace simbólico en un archivo mientras elimina el archivo real como una "copia". Es una pena.