Respuestas:
Encontré esto en http://root42.blogspot.de/2012/10/counting-color-pages-in-pdf-files.html
gs -o - -sDEVICE=inkcov input.pdf | grep -v "^ 0.00000 0.00000 0.00000" | grep "^ " | wc -l
Funcionó bien para mí
El recuento total de páginas se puede encontrar por
pdfinfo input.pdf | grep Pages:
gs -o - -sDEVICE=inkcov input.pdf |tail -n +4 |sed '/^Page*/N;s/\n//'|sed -E '/Page [0-9]+ 0.00000 0.00000 0.00000 / d'
En Linux (y probablemente en Mac / otro Unix), el siguiente script BASH muy breve parece ser el truco:
#!/bin/bash
file="$1"
for page in $(identify -density 12 -format '%p ' "$file") ; do
if convert "$file[$((page-1))]" -colorspace RGB -unique-colors txt:- | sed -e 1d | egrep -q -v ': \(\s*([0-9]*),\s*\1,\s*\1' ; then
echo $page
fi
done
Asigne un nombre similar al script coloredpages.sh
, hágalo ejecutable chmod +x coloredpages.sh
y luego ejecútelo, ./coloredpages.sh "pdfname.pdf"
y debería devolver una lista de números de página.
Esto requiere que ImageMagick y probablemente Ghostscript estén instalados. Y no es la cosa más rápida del mundo.
Lo siento, no tengo idea de cómo adaptar esto para Windows (sin Cygwin o similar, de todos modos).
Al tener la misma tarea que el OP y trabajar en Windows, he encontrado que la siguiente solución funciona de manera rápida y agradable: el SDK de Spool File Page Counter no es gratuito, pero la versión de evaluación aún funciona. Descargue el archivo zip del enlace anterior, descomprímalo y ejecútelo bin/C#_ParsingTest yourfile.pdf
. Verás algo como
Page 1 is [ BW]
Page 2 is [Color]
...
Page 143 is [Color]
============
Statistics: bwPageCount=99, colorPageCount=44
El conteo rápido de PDF mencionado en otra respuesta aquí requiere instalación (que para mi trabajo de una sola vez --- impresión de tesis) es una desventaja. Sin embargo, también hace el trabajo y proporciona una GUI. Después de instalarlo, ejecútelo, arrastre y suelte el archivo PDF en él, verifique Color Pages Counting
Configuración / Opciones, luego haga clic en el Page count files in list
botón.
Curiosamente, los resultados de mi tesis difieren en 1 página (99/44 vs. 100/43). Creo que esto se debe a que alguna figura (hice todo con Inkscape) en realidad es en blanco y negro, pero se describe como color en los metadatos. No estoy seguro. Lo que no encontré en Rapid PDF Count es una lista de todas las páginas en color / blanco y negro, por lo que no puedo decir la fuente exacta de esta discrepancia.