¡Tienes muchas opciones!
pdftotext
de poppler ya se ha mencionado.
Hay un programa llamado Haskellpdf2line
que funciona bien.
calibre 's ebook-convert
programa de línea de comandos (o calibre en sí) es otra opción; puede convertir PDF a texto plano u otro formato de libro electrónico (RTF, ePub), en mi opinión genera mejores resultados que pdftotext, aunque es considerablemente más lento.
ebook-convert file.pdf file.txt
AbiWord puede convertir entre cualquier formato que conozca desde la línea de comandos, y al menos opcionalmente tiene un complemento de importación de PDF:
abiword --to=txt file.pdf
Otra opción más es podofotextextract
de la biblioteca de herramientas PDF de podofo. Realmente no lo he intentado.
Si combina las dos herramientas de Ghostscript pdf2ps
y ps2ascii
tiene otra opción.
De hecho, puedo pensar en algunos métodos más, pero lo dejaré así por ahora. ;)