Tengo un conjunto grande y creciente de archivos de texto, que son bastante pequeños (menos de 100 bytes). Quiero diferenciar cada posible par de archivos y anotar cuáles son duplicados. Podría escribir un script de Python para hacer esto, pero me pregunto si hay una herramienta de línea de comandos de Linux existente (o tal vez una simple combinación de herramientas) que haga esto.
Actualización (en respuesta al comentario de mfinni ): todos los archivos están en un solo directorio, por lo que todos tienen nombres de archivo diferentes. (Pero todos tienen una extensión de nombre de archivo en común, lo que facilita la selección de todos con un comodín).