Estoy usando scanimage
un escáner de documentos (Canon DR-2510C) que admite escaneo dúplex. Desafortunadamente, su controlador SANE no admite la detección de páginas en blanco, por lo que con páginas mixtas (una / dos caras), las páginas en blanco entran en el resultado del escaneo.
Me gustaría deshacerme automáticamente de esas páginas en blanco al procesar la salida de escaneo, por lo que estoy buscando una herramienta de línea de comandos que sea capaz de detectar si un archivo TIFF o PNM se compone principalmente de píxeles blancos).
¿Algunas ideas?
Esta es la solución que se me ocurrió en base a la respuesta de lesmana:
for i in "${DEST_DIR}/out"*.pnm; do
histogram=`convert "${i}" -threshold 50% -format %c histogram:info:-`
white=`echo "${histogram}" | grep "white" | sed -n 's/^ *\(.*\):.*$/\1/p'`
black=`echo "${histogram}" | grep "black" | sed -n 's/^ *\(.*\):.*$/\1/p'`
blank=`echo "scale=4; ${black}/${white} < 0.005" | bc`
if [ ${blank} -eq "1" ]; then
echo "${i} seems to be blank - removing it..."
rm "${i}"
fi
done