Cómo guardar documentos de Word como HTML para verlos en Firefox


10

Necesito guardar un documento de Word como HTML. Tiene algunas imágenes de fondo, otras imágenes, textos, ... Se abre correctamente en Internet Explorer, pero ¿cómo puedo guardar un documento de Word como HTML para que Firefox y otros navegadores actuales lo procesen correctamente?

Faltan todas las imágenes en el documento. Miré a través del documento html generado, pero las rutas para las imágenes parecen ser correctas.

¿Alguna idea?

Cosas como "No guardar documentos como html" no serán útiles aquí.

Editar: para que quede claro, el "Guardar como HTML" normal no lo corta, el resultado se rompe en cualquier navegador que no sea Internet Explorer.

Edición 2: lo que estoy usando es Word 2010 y Firefox 4. También intenté renderizarlo en la última versión de Chrome, que también falló. Utilicé diferentes configuraciones de compatibilidad para guardar como html, no ayudó


2
¿Puede proporcionarnos una captura de pantalla (o una captura de pantalla parcial) que nos muestre de qué manera falla?
Majenko

No describiré ese documento en particular, si no lo suficiente, crearé algo nuevo. Tengo un documento de Word con imagen de fondo en toda la página, tengo otras imágenes en varias ubicaciones y he formateado el texto en la página. El HTML resultante es un fondo blanco, sin imágenes, solo el texto formateado.
private_meta

2
Usar la palabra html es una idea horrible en general. Tengo curiosidad por saber cómo cargarlo en Google Docs y usar su función de salida html, o usar OOo / libreoffice para exportar, funcionaría aunque
Journeyman Geek

No puedo ayudar con el documento de Word en sí. Google Docs muestra la imagen, pero destruye todo el formato incluso más que Word Export. No probé OOo todavía, no lo tengo instalado ahora
private_meta

Acabo de probar en Open Office (3.2. *). Se ve bien en Open Office Writer, pero se rompe cuando se ve en un navegador
private_meta

Respuestas:


6

Al usar Word Save As Page (htm html), justo antes de hacer clic en Guardar, observe el menú desplegable "Herramientas" a la izquierda del botón Guardar. Vaya a este menú desplegable, haga clic en Opciones web. En el cuadro de opciones que aparece, desactive la casilla "Confíe en VML ..." Esto funcionó muy bien para mí. Buena suerte.


¿Qué versión de Word tenías? He mirado hacia arriba en 2003 y todos parecen tener "Confiar en VML ..." sin marcar de forma predeterminada.
Stephen

4

Tengo un truco que implica modificar el código HTML directamente. Estoy usando MS-Office 2007 y FF 10.0.4.

El truco consiste en eliminar la <v:imagedata src = ...>suciedad que genera Word cuando guarda un archivo en HTML y reemplazarlo con el estándar <img src = ...>. El primero (imagedata ...) solo puede ser procesado por IE, mientras que el segundo es estándar y puede ser manejado por todos los navegadores.

Ejemplo:

Eliminar lo siguiente -

<span style='mso-no-proof:yes'><v:shape id="Picture_x0020_2" o:spid="_x0000_i1026"
 type="#_x0000_t75" style='width:282.75pt;height:207.75pt;visibility:visible;
 mso-wrap-style:square'>
 <v:imagedata src="dcsl_overview_files/image006.png" o:title=""/>
</v:shape> </span>

Con:

<img src="dcsl_overview_files/image006.png" alt="overview figure">

2

Encontré el mismo problema. Parece que, por alguna razón, Word exporta HTML normal para algunos documentos.

Por lo general, Word exporta gráficos con dos códigos: uno especial para renderizar en IE y HTML normal para los otros navegadores.

El código se ve a continuación (eliminé gran parte del código para facilitar la lectura)

<p ...><span ...><!--[if gte vml 1]><v:shapetype...>
 [code for IE]
</v:shapetype>
<v:shape id="Picture_x0020_2" ... alt="...png" ...>
 <v:imagedata src="...docx_files/image001.png".../>
</v:shape><![endif]-->
<![if !vml]><img width=169 height=119
src="..."... ><![endif]></span></p>

Observe el condicional?

<!--[if gte vml 1]> IE Code <![endif]--> <![if !vml]> Non IE HTML <![endif]>

Para algunos documentos veo que Word deja de ser bilingüe y exporta solo la parte IE.

Todavía no tengo la solución para estos casos. Sigo investigando


2

Intente guardar como página web, filtro para eliminar etiquetas específicas de Office. En Word 2007, esto limpia todas las etiquetas de Office feas y genera un archivo html limpio.


1

Solo probé un documento simple, renderizado en Chrome, así que YMMV , pero ¿ha intentado guardarlo como Web Page, Filtered(disponible en mi copia de Word 2010, y supongo que en todas las versiones).

Esto debería eliminar muchas de las peores cosas, pero aún así, el resultado puede no ser siempre HTML perfecto y neutral para el navegador.


0

En la barra de herramientas de acceso rápido, hay una opción llamada Vista previa de la página web . Creo que esto debería funcionar (lo probé cuando tenía Word 2007 y no sé si está disponible en 2010 y 2013).


-2

Como aparentemente nada más funcionó, se convirtió en una de estas malditas soluciones "solo para IE".

Editar: Solo para aclarar: respondí esto yo mismo ya que no recibí ninguna otra respuesta durante 8 meses. Como ya no necesito la solución en este momento, y fue hace mucho tiempo, no aceptaré / no puedo aceptar otra solución.


Otras personas pueden encontrar el mismo problema, incluido yo mismo. Entonces es una pregunta muy útil. Sea lo suficientemente amable y marque la respuesta que cree que resuelve el problema. Personalmente, encuentro que @Saurabh Bagchi responde una buena solución.
Alin C
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.