Uno de nuestros proveedores comenzó a agregar una imagen innecesariamente grande a la última página de archivos PDF que recibimos de ellos. Necesito recortar esto. Sin embargo, tenemos cientos de estos, por lo que es prohibitivo ingresar manualmente. ¿Cuáles son las mejores formas de extraer y luego eliminar (preferiblemente primero una, luego la otra; todavía necesito confirmar a través del tamaño del archivo que no estoy eliminando una que no tiene la imagen) la última página de un PDF automáticamente? El sistema operativo es Linux.
Puedo extraerlo usando ghostscript, con algo similar, gs -dFirstPage=5 -dLastPage=5
pero necesito automatizar esto, no puedo pasar y averiguar manualmente cuál es el número de la última página.
¿Algunas ideas?
Editar: para aclarar, simplemente quiero dividir / eliminar la última página. No es la imagen que contiene, elimine el último período de la página.
pdftk
, estoy seguro de que se puede hacer que funcione en general para este tipo de tarea.