Las personas que hacen TinEye tienen un producto llamado PixMatch que puede buscar colecciones individuales. Sin embargo, no se implementa como una aplicación de escritorio: es una API basada en servidor. Y parece tener un precio para uso empresarial serio, no para individuos. Así que ahí está , pero en realidad no es una respuesta.
Pero una empresa competidora tiene algo para el escritorio: Imense Desktop Similar Image Search , que se ejecuta en Apple Mac OS o Microsoft Windows con Adobe Bridge CS4 . Es gratis para colecciones de hasta 4000, y parece tener un precio razonable por encima de eso.
De hecho, hay un montón de cosas, una vez que descubrí qué buscar: recuperación de imágenes basada en contenido . En realidad, hay mucho trabajo en esta área, y una tonelada de herramientas de código abierto y cerradas . La mayoría de estos se centran en el lado de las grandes empresas / academia, y se encuentran en varios estados de finalización y pulido.
De estos, creo que imgSeek es el más interesante para el caso de escritorio. Esto está basado en Python / QT y, por lo tanto, en teoría debería ejecutarse en casi cualquier plataforma, pero está enfocado en Linux. Realiza comparaciones basadas en metadatos (fecha, hora, etc.), características simples como luminosidad o color promedio, o mediante una sofisticada estimación de similitud basada en ondas . Probablemente sea excesivo para encontrar exactamente la misma imagen en un tamaño diferente con una compresión diferente, pero debería funcionar realmente bien, ya que ese es básicamente el caso más fácil posible. También encontrará coincidencias cercanas, como esta:
Todo eso puede ser demasiado trabajo para este problema específico de una sola vez. ¿Cómo se almacenan tus fotos no organizadas? Incluso si sus nombres de archivo no son útiles, los metadatos EXIF deberían ser buenos. Un enfoque simple es importarlos a un programa que pueda examinar estos datos y buscarlos u ordenarlos. O bien, puede usar un programa como jhead para cambiarles el nombre a todos para que tengan nombres razonables basados en fechas. (Tal vez ambos.)