¿Cómo buscar en archivos PDF utilizando expresiones regulares?


15

Por lo general, uso Notepad ++ para buscar en archivos utilizando expresiones regulares. Hoy me pregunto si hay un programa PDF que haga lo mismo para los PDF. Por supuesto, podría convertir el PDF a texto y usar Notepad ++, pero ¿hay alguna manera más fácil sin convertir?


1
¿Qué sistema operativo estás usando?
Scott McClenning

Windows Developer Preview y Windows 7
Michael S.

Respuestas:



4
  1. Agent Ransack es gratuito (lite) y admite PDF como lo confirman sus notas de la versión.
  2. PowerGREP es un producto comercial.

Tal como dijiste, la alternativa evidente es convertir archivos PDF a texto. Una forma para que un programador configure eso para el procesamiento masivo es usando el paquete PDFMiner de Python. Agent Ransack usa "pdftotext" del proyecto Xpdf (y usted también puede hacerlo).


nota al margen: Agent Ransack es la versión lite de FileLocator
akira

¡Gracias! Miré más de cerca. Las notas de la versión del proveedor confirman que File Locator Lite, también conocido como Agent Ransack, es compatible con PDF. Editando mi respuesta.
minopret

El agente Ransack hace el trabajo. También es posible que desee probar DnGrep.
Michael S.
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.