¿Cómo convertir archivos .PDF y .doc / .docx a archivos .HTML?


3

¿Alguien sabe de algún software (preferiblemente de código abierto, Linux o PHP) que pueda convertir PDF y / o DOC / DOCX (y tal vez otros formatos de documentos también: rtf, txt, etc.) a HTML?

Tengo el software "PDFtoHTML" funcionando pero no parece que también convierta archivos DOC / DOCX.

Respuestas:


1

Deberías darle una vuelta a unoconv . Debería poder convertir cualquier cosa que Open Office pueda leer en cualquier cosa que pueda escribir.

Esto funciona en doc / docx y en muchos otros archivos. Parece que no funciona en PDF, así que supongo que está atascado con el uso de 2 programas separados para el trabajo.


hola jpjacobs, gracias por el consejo, no había oído hablar de unoconv, lo intentaré, ¡gracias! -tim

1

Puse con éxito una versión portátil de libreoffice en el servidor web de mi host, que llamo con PHP para hacer una conversión de línea de comandos a .docx, etc. a pdf. sobre la marcha. No tengo derechos de administrador en el servidor web de mi host. Aquí está mi publicación de blog de lo que hice:

http://geekswithblogs.net/robertphyatt/archive/2011/11/19/converting-.docx-to-pdf-or-.doc-to-pdf-or-.doc.aspx

¡Hurra! ¡Convierta directamente de .docx o .odt a .pdf usando PHP con LibreOffice (el sucesor de OpenOffice)!


Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.