No se pudo encontrar ninguna documentación oficial (no es de extrañar) pero de acuerdo con este interesante artículo , esos elementos se inyectan para permitir que Word vuelva a convertir el HTML en un documento de Word totalmente compatible, con todo preservado.
El párrafo relevante:
Microsoft agregó las etiquetas especiales al HTML de Word con miras a la compatibilidad con versiones anteriores. Microsoft quería que pudiera guardar archivos en HTML completo con todo el seguimiento, comentarios, formato y otras características especiales de Word que se encuentran en los archivos DOC tradicionales. Si guarda un archivo en HTML y luego lo vuelve a cargar en Word, teóricamente no pierde nada en absoluto.
Esto tiene mucho sentido.
Para su pregunta específica ... o
en <o:p>
significa "espacio de nombres de Office", por lo que cualquier cosa que siga o:
en una etiqueta significa "Soy parte del espacio de nombres de Office"; en caso de <o:p>
que solo signifique párrafo, el equivalente de la <p>
etiqueta ordinaria .
Supongo que cada etiqueta HTML tiene su "equivalente" de Office y tienen más.