No se pudo encontrar cualquier documentación oficial (no es sorpresa) pero de acuerdo con this interesting article, esos elementos se inyectan para permitir que Word convierta el HTML de nuevo a Word compatible. cument, con todo conservado.
El párrafo pertinente:
Microsoft añaden las etiquetas especiales a HTML de la palabra con un ojo hacia la compatibilidad con versiones anteriores. Microsoft quería que pudiera guardar archivos en HTML completos con todo el seguimiento, los comentarios, el formato y otras funciones especiales de Word que se encuentran en los archivos DOC tradicionales. Si guarda un archivo en HTML y lo vuelve a cargar en Word, teóricamente no perderá nada.
Esto tiene mucho sentido.
Para su pregunta específica .. la o
en los medios <o:p>
"Oficina espacio de nombres" así que cualquier cosa después de la o:
en una etiqueta significa "Soy parte de la Oficina de espacio de nombres" - en el caso de <o:p>
sólo significa párrafo, el equivalente de la etiqueta ordinaria <p>
.
Supongo que cada etiqueta HTML tiene su Office "equivalente" y tienen más.
Si buscas * limpiar * el desorden, mira esta publicación del blog de Jeff: http://www.codinghorror.com/blog/2006/01/cleaning-words-nasty-html.html –
He votado a favor, no podemos saber quién votó negativamente, lo siento. Un pequeño cambio es @leonbloy (eliminó una etiqueta) pero lo dudo. –