Tengo un archivo XML que especifica una codificación, y uso UnicodeDammit para convertirlo a Unicode (por razones de almacenamiento, no puedo almacenarlo como una cadena). Luego lo paso a lxml pero se niega a ignorar la codificación especificada en el archivo y analizarlo como Unicode, y se genera una excepción.¿Hay alguna manera de obligar a lxml a analizar las cadenas Unicode que especifican una codificación en una etiqueta?
¿Cómo puedo forzar a lxml a analizar el documento? Este comportamiento parece demasiado restrictivo.
Todo el problema es que no puedo conseguir un árbol en primer lugar, si pudiera me wouldn' t tiene algún problema ... –
@Stavros Korokithakis, etree es un módulo, no el árbol analizado. –
@Daniel Kluev: Sí, pero "árbol" es un árbol. –