He pasado los últimos días aprendiendo los principios básicos de lxml; en particular, utilizando lxml.html para analizar sitios web y crear un ElementTree del contenido. Idealmente, quiero guardar el ElementTree devuelto para que pueda cargarlo y experimentar con él, sin tener que analizar el sitio web cada vez que modifico mi script. Supuse que el decapado sería el camino a seguir, sin embargo, ahora estoy empezando a preguntarme. A pesar de que soy capaz de recuperar un objeto elementtree después del decapado ...guardando un objeto 'lxml.etree._ElementTree'
type(myObject)
vuelve
<class 'lxml.etree._ElementTree'>
el objeto en sí parece ser 'vacío', ya que ninguno del método posterior/atributo llama hago en ella produce cualquier salida.
Supongo que el decapado no es apropiado aquí, pero ¿alguien puede sugerir una alternativa?
(En caso de que las cosas, lo anterior está ocurriendo en: python3.2, lxml 2.3.2, nieve-leopardo))
Gracias por la respuesta. Desafortunadamente, mi comprensión de lxml, árboles de elementos y similares es tan incompleta que no entiendo las sugerencias que usted ha hecho.Intenté recorrer el manual de lxml durante los últimos días pero no he llegado a ninguna parte, así que voy a dejar este proyecto por el momento. –
El método de escritura sugerido me dio un error en python3, pero cambiar de 'w' a 'wb' lo hizo funcionar. – deinonychusaur
@Tomalak: Muchas gracias por la corrección. – unutbu