2011-03-22 9 views
18

Esta es una pregunta tan básica que en realidad no lo encuentro en la documentación: -/Preguntas lxml increíblemente básicas: ¿obtener contenido de HTML/cadena de lxml.etree._Element?

En el siguiente:

img = house_tree.xpath('//img[@id="mainphoto"]')[0] 

¿Cómo puedo obtener el código HTML de la etiqueta <img/>?

He intentado agregar html_content() pero obtengo AttributeError: 'lxml.etree._Element' object has no attribute 'html_content'.

Además, era una etiqueta con contenido dentro (por ejemplo, <p>text</p>) ¿cómo obtendría el contenido (por ejemplo, text)?

¡Muchas gracias!

Respuesta

38

supongo que será tan simple como:

content = el.text_content() 
:

from lxml.etree import tostring 
inner_html = tostring(img) 

En cuanto a conseguir el contenido desde el interior <p>, por ejemplo, algún elemento seleccionado el

Cuestiones relacionadas