Identificación
Encontré esta herramienta que parece ser lo que puede usar para identificar archivos PDF / A. Se llama DROID (registro digital e identificación de objetos) . Está basado en Java y se puede ejecutar desde una GUI o la línea de comandos.
extracto
DROID es una herramienta de software desarrollada por The National Archives para realizar la identificación automatizada de lotes de formatos de archivo. Desarrollado por su Departamento de Preservación Digital como parte de sus actividades de preservación digital más amplias, DROID está diseñado para cumplir con los requisitos fundamentales de cualquier repositorio digital para poder identificar el formato preciso de todos los objetos digitales almacenados y vincular esa identificación a un registro central. de información técnica sobre ese formato y sus dependencias.
Dado que está patrocinado por los Archivos Nacionales, supongo que es la herramienta adecuada para hacerlo, dado el propósito previsto del formato PDF / A. Además, el proyecto es de código abierto y el código está disponible en Github , así como empaquetado en forma binaria desde el sitio web de los Archivos Nacionales .
Validación y Conversión
Si está buscando una herramienta para realizar la validación y conversión, creo que PDFBox puede hacer esto. PDFBox enumera la validación PDF / A directamente en la página principal de su sitio web. Es otra aplicación Java 8-).
extracto del sitio web
Validación de PDF / A
Valide los PDF contra el estándar PDF / A ISO.
En la sección de herramientas de línea de comandos a la izquierda de su página principal, muestra el siguiente uso de la herramienta:
$ java -jar pdfbox-app-x.y.z.jar org.apache.pdfbox.ConvertColorspace [OPTIONS] <inputfile> <outputfile>
veraPDF es otra herramienta capaz de validar PDF / A; Es parte del conjunto de herramientas de referencia de la Open Preservation Foundation. También es una aplicación Java.
Conversión
Para hacer la conversión, encontré este método en una publicación del blog titulada: forma gratuita de convertir un PDF existente a PDF / A , que utiliza las siguientes herramientas:
- Ghostscript 8.64 solamente.
- PDFBox 0.7.3
- pdfmarks (archivo para suministrar metadatos adicionales)
- PDFA_def.ps
- USWebCoatedSWOP.icc
Con lo anterior en su lugar, utiliza el siguiente comando:
$ gs -sDEVICE=pdfwrite -q -dNOPAUSE -dBATCH -dNOSAFER \
-dPDFA -dUseCIEColor -sProcessColorModel=DeviceCMYK \
-sOutputFile=Out_PDFA.pdf PDFA_def.ps pdfmarks IN_PDF.pdf
No es sin sus verrugas. El artículo analiza uno de ellos, arreglando las banderas de impresión en hipervínculos siendo uno de ellos. El artículo proporciona una aplicación Java que puede usar para solucionar estos problemas:
$ java FixPrintFlag Out_PDFA.pdf New_verifiablePDFA.pdf
No es bonito, pero parece ser viable. Vea el artículo para más detalles.
Referencias