Acabo de descargar HTMLAgilityPack y la documentación no tiene ningún ejemplo.¿Cómo puedo usar HTML Agility Pack para recuperar todas las imágenes de un sitio web?
Estoy buscando una manera de descargar todas las imágenes de un sitio web. Las cadenas de direcciones, no la imagen física.
<img src="blabalbalbal.jpeg" />
Necesito extraer la fuente de cada etiqueta img. Solo quiero conocer la biblioteca y lo que puede ofrecer. Todos dijeron que esta era la mejor herramienta para el trabajo.
Editar
public void GetAllImages()
{
WebClient x = new WebClient();
string source = x.DownloadString(@"http://www.google.com");
HtmlAgilityPack.HtmlDocument document = new HtmlAgilityPack.HtmlDocument();
document.Load(source);
//I can't use the Descendants method. It doesn't appear.
var ImageURLS = document.desc
.Select(e => e.GetAttributeValue("src", null))
.Where(s => !String.IsNullOrEmpty(s));
}
Qué tipo de objeto es el documento en su ejemplo? No puedo usar el método .Descendientes. Por favor revisa mi edición. –
Olvidé incluir '.DocumentNode'. – SLaks
también compruebe que está utilizando la versión beta más reciente, ya que la funcionalidad de linq es nueva – rtpHarry