Traté de analizar HTML con el HtmlAgilityPack de la siguiente manera:Eliminar espacios en blanco y saltos de línea al analizar con HtmlAgilityPack
HtmlDocument htmlDoc = new HtmlDocument();
htmlDoc.LoadHtml(xhtmlString);
Por desgracia, la xhtmlString contiene espacios en blanco innecesarios y caracteres de nueva línea, por lo que el _TEXT de htmldoc ahora se ve así :
<html xmlns=\"http://www.w3.org/1999/xhtml\">\n\t<head></head>\n\t<body>\n\n<p>Alle Auktionen<br /></p>\n\n\t</body>\n</html>
Esto es un problema para mí cuando se trabaja con los elementos secundarios del cuerpo.
¿Cuál es la forma más fácil de eliminar estos caracteres innecesarios?
¿El HtmlAgilityPack ofrece algún tipo de función para limpiar HTML de nuevas líneas y pestañas?
¿Hay una manera que podría utilizar String.Replace para resolver esto? –