No es posible determinar si un archivo en un torrent también existe en otro torrent a partir de los datos disponibles en los archivos .torrent. Simplemente no hay soporte de deduplicación en el protocolo estándar BitTorrent.
Cuando se crea un torrent, todos los archivos que contiene se concatenan juntos y luego se fragmentan.
example:
Files |---#1|#2|---#3|-----------------------#4|#5|------#6|-----#7|-------#8|
Pieces |--0|--1|--2|--3|--4|--5|--6|--7|--8|--9|-10|-11|-12|-13|-14|-15|-16|17|
- Todas las piezas tienen la misma longitud excepto la última.
- Un archivo tiene una o más piezas.
- Una pieza puede contener (partes de) más de un archivo.
- Es muy raro que los archivos internos y los límites de las piezas se alineen (excepto si se usan archivos de relleno).
- Un archivo en un torrent de varios archivos casi siempre tiene una pieza compartida con otro archivo.
El problema es que no es posible crear un hash de archivo a partir de los hash de la pieza.
(@jdwolf Incluso si el archivo n. ° 1 y el archivo n. ° 3 son idénticos, todos los hash de sus piezas serán diferentes).
Hay algunos programas creadores de torrent que opcionalmente pueden agregar hashes de archivos, pero afaik no se usa en ningún lado.