¿Cómo puedo identificar archivos de imagen duplicados?


16

A lo largo de los años, he acumulado muchas fotos, en un montón de máquinas diferentes.

Creo que los he mantenido principalmente en una estructura de directorio aaaa / mm /, pero especialmente con algunas de las imágenes más antiguas, parece que hay muchos duplicados.

¿Cuál es la mejor manera de identificar los duplicados? ¿Existen buenas herramientas para hacer esto, o tendré que escribir algo por mi cuenta?


3
¿Está buscando encontrar coincidencias aproximadas (por ejemplo, la misma imagen, diferentes metadatos) o encontrar coincidencias exactas es lo suficientemente bueno?
mattdm

Las coincidencias exactas serán lo suficientemente buenas.
Chris

tal vez mirar los tamaños de archivo?
aaaaa dice que reinstalar a Monica el

Respuestas:


7

Varios programas pueden encontrar duplicados basados ​​en el contenido de la imagen. Algunas aplicaciones de gestión de activos lo harán y también hay programas dedicados. Si Google 'detecta imágenes duplicadas', verá bastantes opciones. Vea cuáles están disponibles para su plataforma.

Otra solución es simplemente importar los archivos con la "opción duplicar ignorar". Picasa, que es gratis, puede hacerlo.


Google detecta imágenes duplicadas en realidad funciona como se prometió. Se puede encontrar un buen número de este tipo de software. ¿Puedes recomendar algo más que Picasa?
Esa Paulasto

4

Para Linux, intente FSlint . Es un poco lento, pero definitivamente encontrará duplicados.


FSlint buscará archivos con el mismo valor hash. Como tal, encontrará duplicados de cualquier archivo. No ayudará con el escenario 'misma imagen-metadatos diferentes' o con versiones redimensionadas del original.
seb

4

dupeGuru Picture Edition es un buscador de imágenes duplicadas personalizable para Windows, Mac OS X y Linux.

Hay algunas versiones de dupeGuru (ediciones estándar, de música e imagen), y la edición de imagen le permite encontrar imágenes visualmente similares a través de un algoritmo de comparación de bloqueo de mapa de bits, entre otros métodos (como la marca de tiempo de imagen original EXIF, o los archivos son simplemente idénticos) .

Tiene una variedad de otras características útiles como carpetas excluidas, soporte para bibliotecas iPhoto / Aperture y una considerable personalización de cómo detecta duplicados y qué hace con ellos.


3

Picasa tiene un buscador de archivos duplicados, pero es difícil saber lo que está viendo: ejecute Picasa; clic Tools> Experimental> Show Duplicate Files. Se trabaja pero tenga cuidado acerca de lo que va a eliminar.

Otra opción es el "Buscador de archivos duplicados rápido" gratuito :

Buscador de archivos duplicados rápido

Lo que me gustó de esto es que te permite previsualizar la imagen antes de decidir que no necesitas el duplicado.

texto alternativo

Eso funciona bien siempre que los archivos sean idénticos , pero si está buscando fotos similares (por ejemplo, la misma foto pero redimensionada, rotada o manipulada), es posible que desee ver su versión actualizada:

Buscador de imágenes duplicadas de similitud visual

No he usado este programa pero utilicé un programa muy similar (ya no se hizo) y lo encontré muy útil. Tienen una descarga gratuita, por lo que vale la pena echarle un vistazo.


Intenté el picasa dupe finder, pero parece coincidir con imágenes similares, no con archivos idénticos.
Chris

2

digikam (linux, windows y mac) tiene una barra lateral titulada versiones

La pestaña Versiones muestra el historial y las versiones guardadas de una fotografía. Con los tres botones en la esquina superior derecha, puede elegir entre una lista simple de las versiones guardadas, una vista de árbol y una lista combinada que muestra las versiones junto con las acciones realizadas con la fotografía seleccionada.

y otra búsqueda titulada

Búsqueda rápida es el cuadro de búsqueda adaptable en la parte superior del cuadro de diálogo de búsqueda (Barra lateral izquierda) y le proporciona un medio simple para buscar en la base de datos digiKam con una sola consulta. Puede ingresar cualquier argumento en el campo de búsqueda: texto y se usará para determinar los resultados. Por ejemplo, puede ingresar la cadena 'cumpleaños' para buscar en la base de datos completa las apariciones de la palabra 'cumpleaños' en todos los campos de texto de metadatos, o '05 .png 'para buscar un nombre de archivo de imagen específico '05 .png' ( sin escape como en expresiones regulares necesarias).

(También tiene una configuración avanzada que permite múltiples búsquedas booleanas)

y otro titulado fuzzy

digiKam caracteriza cada imagen por un largo número utilizando una técnica especial (algoritmo Haar) que permite comparar imágenes comparando esta firma calculada. Cuanta menos diferencia numérica haya entre dos firmas de imagen, más se parecen entre sí. Esta técnica tiene tres implementaciones en digiKam: ...

  1. Duplicados
  2. Imagen (artículos similares)
  3. Bosquejo

Aunque la generación de las "firmas" y la verificación cruzada de ellas en una gran cantidad de imágenes puede ser un proceso lento. También tenga en cuenta que algunas personas no son fanáticas porque es un proyecto de KDE que no se integra totalmente con otros entornos de escritorio y trata de ser una aplicación todo en uno con descarga de imágenes, catálogo / palabras clave, desarrollo RAW, manipulación de imágenes y más incluido.



1

Mis dos centavos. He utilizado:

Pixiple github.com/saolaolsson/pixiple

VisiPics visipics.info

E impresionante buscador de fotos duplicadas duplicate-finder.com

Una cosa a considerar es la "confusión" de la búsqueda. A veces, el programa encuentra fotos similares, por ejemplo, variaciones de la misma sesión de fotos. No tenga un desencadenante feliz al eliminar sus imágenes.


Por favor, haga una copia de seguridad de sus imágenes antes de eliminar algo.


0

Acdsee es una aplicación de exploración de fotos simple / popular que tiene esta característica (Herramientas -> Buscar duplicados).


0

En mi Mac, he tenido un éxito excelente con PhotoSweeper ( http://overmacs.com/ ). Puede funcionar directamente a través del sistema de archivos o mediante un software de fotografía popular como Apple Photos y Adobe Lightroom. Es capaz de encontrar duplicados exactos o archivos de imágenes similares. Y a $ 10, es una ganga.


-1

DeDup-Image es un script bash para buscar y eliminar automáticamente imágenes idénticas / fotos duplicadas, incluso si los metadatos difieren. Siempre conserva la copia más grande, que probablemente contiene la mayor cantidad de metadatos y elimina todos los demás objetos encontrados basados ​​en el SHA256-HASH de la información de la imagen real sin ningún metadato. Debido a que el script necesita procesar una variante de cada imagen sin metadatos, es un poco más lento y requiere más procesador que los programas o scripts que solo pueden buscar archivos completamente idénticos.


44
Este programa se ve muy peligroso porque se elimina automáticamente. Realmente, realmente no quisiera que ningún programa elimine archivos aquí y allá.
Rafael
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.