Estoy usando HtmlUnit para generar el HTML para varias páginas, pero ahora mismo, lo mejor que puedo hacer para convertir la página en el HTML sin formato que devuelve el servidor es convertir HtmlPage en una cadena XML.HtmlUnit - ¿Convierte una HtmlPage en una cadena HTML?
Esto es un poco molesto porque la salida XML es representada por los navegadores web de manera diferente que el HTML sin procesar. ¿Hay alguna manera de convertir una HtmlPage en HTML sin formato en lugar de XML?
Gracias!
getWebResponse() devuelve la página original, sin las modificaciones realizadas por los scripts. Entonces, como Xml() y asText() es una mejor solución para obtener la página final. – snorbi