Creo que su mejor enfoque sería convertir el PDF a imágenes con una resolución decente y luego comparar una imagen.
Para generar imágenes a partir de PDF, puede utilizar Adobe PDF Library o la solución sugerida en Mejor forma de convertir archivos pdf a archivos tiff .
Para comparar los archivos TIFF generados, encontré GNU tiffcmp (para Windows parte de GnuWin32 tiff ) y tiffinfo hizo un buen trabajo. Utilice tiffcmp -l y cuente el número de líneas de salida para encontrar las diferencias. Si está contento de tener una pequeña cantidad de cambio de contenido (por ejemplo, diferencias de suavizado), use tiffinfo para contar el número total de píxeles y luego puede generar un valor de diferencia porcentual.
Por cierto, para cualquiera que haga una comparación simple de PDF donde la estructura no ha cambiado, es posible usar la línea de comando diff e ignorar ciertos patrones, por ejemplo, con GNU diff 2.7:
diff --brief -I xap: -I xapMM: -I / CreationDate -I / BaseFont -I / ID --binary --text
Esto todavía tiene el problema de que no siempre detecta cambios en los nombres de fuente generados.