¿Alguien ha integrado BeautifulSoup con ASP.NET/C# (posiblemente usando IronPython o de otro modo)? ¿Existe una alternativa BeautifulSoup o un puerto que funciona muy bien con ASP.NET/C#BeautifulSoup y ASP.NET/C#
La intención de la planificación para utilizar la biblioteca es extraer legible texto desde cualquier dirección URL aleatoria.
Gracias
¿Cómo iba a usar H AP para raspar texto legible de una página HTML. En BeautifulSoup, es muy fácil hacer esto. – user300981
He actualizado mi respuesta –
¿El DocumentNode.InnerText obtiene todo el texto dentro de las etiquetas
? Mi preocupación es que necesito apoyar esto para las URL que no siguen ningún estándar. Puede haber suciedad por todas partes. ¿HAP es lo suficientemente inteligente como para distinguir entre texto legible y etiquetas HTML irrelevantes, comentarios, secuencias de comandos del cliente? – user300981