Actualmente utilizo el lector de PDF de Foxit, y recientemente descargué una imagen de Internet, pero está dentro de un archivo PDF. ¿Cómo extraigo esta imagen?
El sistema operativo es Windows 7.
Actualmente utilizo el lector de PDF de Foxit, y recientemente descargué una imagen de Internet, pero está dentro de un archivo PDF. ¿Cómo extraigo esta imagen?
El sistema operativo es Windows 7.
Respuestas:
La forma rápida si no necesita una resolución original de píxeles de la imagen es presionar ALT y los botones Imprimir pantalla. Luego elige pegar donde quieras la imagen.
La otra forma de preservar la resolución es abrir el PDF en un programa de edición de imágenes como Adobe Photoshop y trabajar con él allí.
pdfimages.exe
viene útil.
Si descarga XPDF para Windows ( aquí ), encontrará algunos archivos .exe dentro. Puede ejecutarlos sin "instalación". Usar pdfimages.exe
así:
pdfimages.exe -help
Esto muestra la pantalla de ayuda.
pdfimages.exe ^
-j ^
c:\path\to\your.pdf ^
c:\path\to\where\you\want\images\prefix\
Esto extrae todos los archivos JPEG como prefijo-00N.jpg, y todas las demás imágenes como prefijo-00N.ppm (Portable PixMap).
[ Editar por ComFreek: tenga en cuenta la barra diagonal final en la ruta de destino, que es importante si no desea extraer todas las imágenes en su directorio principal.] -
{ Editar por KurtPfeifle: No estoy de acuerdo con el comentario de ComFreek, pero deje Es para que los lectores prueben y descubran las diferencias en los resultados mismos. Mi parámetro original, que no usa una barra inclinada final, ya ..\prefix
que prefijará los nombres de imagen utilizados para los archivos extraídos.}
pdfimages.exe ^
-j ^
-f 11 ^
-l 13 ^
c:\path\to\your.pdf ^
c:\path\to\where\you\want\images\prefix\
Igual que antes, pero limita la extracción de imágenes a las páginas 11 ('f' = primero) a 13 ('l' = último).
Mientras tanto, prefiero la versión de Poppler,pdfimages
especialmente desde que adquirió esta nueva característica: agregar -list
a la línea de comandos para enumerar (no extraer) las imágenes contenidas en el PDF, además de algunas de sus propiedades. Ejemplo:
pdfimages -list -f 7 -l 8 ct-magazin-14-2012.pdf número de página tipo ancho altura color comp bpc enc interp ID de objeto -------------------------------------------------- ------------------- 7 0 imagen 581838 rgb 3 8 jpeg no 39 0 7 1 imagen 4 4 rgb 3 8 imagen no 40 0 7 2 imagen 314 332 rgb 3 8 jpx no 44 0 7 3 imagen 358430 rgb 3 8 jpx no 45 0 7 4 imagen 4 4 rgb 3 8 imagen no 46 0 7 5 imagen 4 4 rgb 3 8 imagen no 47 0 7 6 imagen 4 6 rgb 3 8 imagen no 48 0 7 7 imagen 596 462 rgb 3 8 jpx no 49 0 7 8 imagen 4 6 rgb 3 8 imagen no 50 0 7 9 imagen 4 4 rgb 3 8 imagen no 51 0 7 10 imagen 8 10 rgb 3 8 imagen no 41 0 7 11 imagen 6 6 rgb 3 8 imagen no 42 0 7 12 imagen 113 27 rgb 3 8 jpx no 43 0 8 13 imagen 582839 gris 1 8 jpeg no 2080 0 8 14 imagen 344364 gris 1 8 jpx no 2079 0
Tenga en cuenta nuevamente: esta versión de pdfimages
es la de Poppler (la de XPDF (¿todavía no es compatible?) Con esta nueva característica), y la versión debe ser v0.20.2 o posterior.
convert
. Disponible para Linux, Windows, MacOS X y lo que tengas. Más fácil de casos de uso para usted: convert some.ppm some.jpeg
.
pdfimages
, y algunas personas podrían preferir usar eso.
Puede intentar importar el PDF a Inkscape y trabajar desde allí. Inkscape solo abrirá una página a la vez, pero le dará un control completo sobre el contenido de la página. Podrá extraer y manipular gráficos vectoriales del PDF con bastante facilidad.
Sin embargo, si desea extraer imágenes ráster del PDF, estoy bastante seguro pdfimages
de que XPDF es más fácil (pero aún puede intentar usar Inkscape después de aprender cómo extraer imágenes incrustadas de archivos SVG ).
Sin instalar ningún software, puede cambiar a PDF-XChange Viewer (seleccione Versión portátil ) que ya tiene esta capacidad incorporada
puede guardar varias páginas como TIFF de varias páginas
Tenga en cuenta que mientras este método convierte páginas PDF completas en imágenes, el método explicado desde @Laurenz usando Sumatra PDF es superior si desea extraer imágenes de una página PDF con contenido mixto (imagen + texto) para obtener solo la imagen.
Sumatra PDF es un lector de PDF de código abierto rápido y liviano que puede copiar imágenes directamente al portapapeles, sin ninguna rasterización.
MuPDF es un nuevo visor de PDF multiplataforma (de escritorio y móvil) lanzado bajo licencia AGPL. Lo mantienen las mismas personas de Ghostscript .
Contiene una herramienta de línea de comandos para extraer imágenes de un PDF:
mutool extract [options] file.pdf [object numbers]
El comando de extracción se puede utilizar para extraer imágenes y archivos de fuentes de un PDF. Si no se dan números de objeto en la línea de comando, se extraerán todas las imágenes y fuentes.
-p password
Use the specified password if the file is encrypted.
-r Convert images to RGB when extracting them.
uso pdftocairo
de poppler toolkit
. Puede extraer y convertir imágenes de pdf a cualquier formato deseado. Siempre genera imágenes y nunca genera ppm o algunos dados como ese. El siguiente comando oculta las páginas pdf a imágenes jpg:
pdftocairo.exe -jpeg "my.pdf" "my"
Puede obtenerlo desde aquí para Windows: http://blog.alivate.com.au/poppler-windows/
También está disponible en Linux.
http://www.sumnotes.net/ es una herramienta en línea para extraer notas, resaltados e imágenes. Lo utilicé ampliamente en la universidad para mi tesis y estaba realmente satisfecho.
normalmente extraigo la imagen incrustada con 'pdfimages' en la resolución nativa, luego uso la conversión de ImageMagick al formato necesario:
$ pdfimages -list fileName.pdf
$ pdfimages fileName.pdf fileName # save in .ppm format
$ convert fileName-000.ppm fileName-000.png
Esto genera el mejor y más pequeño archivo de resultados.
Nota: Para imágenes incrustadas JPG con pérdida, tenía que usar -j:
$ pdfimages -j fileName.pdf fileName # save in .jpg format
En una plataforma Win poco proporcionada, tuvo que descargar un binario reciente (0.37, 2015) 'poppler-util' de: http://blog.alivate.com.au/poppler-windows/
ACTUALIZACIÓN: En el reciente "poppler-util" 0.50+ (2016), pdfunite tiene una opción "-todos" para extraer un mapa de bits comprimido sin pérdidas como .png y un mapa de bits comprimido con pérdidas como .jpg, así de simple:
$ pdfimages -all fileName.pdf fileName
extraer siempre el mejor contenido de calidad posible de PDF