Tengo un montón de mensajes duplicados en el servidor Maildir de mi servidor IMAP. ¿Cuál es la mejor manera de eliminarlos?
Algunos puntos relevantes:
- El ID de mensaje compartido suele ser una definición suficientemente buena de duplicado. Un pequeño script que elimina todos los mensajes duplicados, excepto uno, funcionaría.
- A veces es necesario encontrar duplicados basados en cuerpos de mensajes compartidos. ¿Cuál es una definición razonable de compartido aquí? Bitwise equivalente? ¿Qué pasa con las extrañas diferencias en el ajuste de línea, el escape y la codificación de caracteres?
- A veces hay una diferencia significativa entre los mensajes 'duplicados'. ¿Cuál es la mejor manera de revisar las diferencias en conjuntos de mensajes 'duplicados'? Diferencias?