Estoy buscando en un documento HTML usando XPath desde lxml en python. ¿Cómo puedo obtener el camino a un cierto elemento? Aquí está el ejemplo de nokogiri rubí:¿Cómo obtener la ruta de acceso de un elemento en lxml?
page.xpath('//text()').each do |textnode|
path = textnode.path
puts path
end
de impresión, por ejemplo, '/html/cuerpo/div/div [1]/div [1]/p/texto() [1]' y este es el cadena que quiero obtener en python.
Creo que debería ser 'for e in tree.iter():', es decir ** tree **. Iter. – Jabba
@Jabba ¿Y por qué piensas eso? ¿Has probado el código que proporcioné tal como es? Parece que funciona, ¿no? ¿Tiene un ** motivo ** para pensar lo contrario? – nosklo
Podría no haber existido cuando escribió esto originalmente y no es que realmente importe, pero también puede hacer 'tree = root.getroottree()' para obtener un objeto ElementTree. –