Tengo un documento bastante grande en formato html generado a partir de Microsoft Word. Es tan sucio y lleno de cosas hinchadas (como etiqueta desconocida, espacio de nombres desconocido, etc. y otras cosas hinchadas)cómo limpiar microsoft html doc?
¿hay alguna forma de convertirlo en sintaxis html simple?