Estoy tratando de analizar un documento XML recupero de la web, pero se bloquea después de analizar con este error:error 'no se pudo cargar entidad externa' al utilizar Python lxml
': failed to load external entity "<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="GreenButtonDataStyleSheet.xslt"?>
Esa es la segunda línea en el XML que se descarga. ¿Hay alguna manera de evitar que el analizador intente cargar la entidad externa u otra forma de resolver esto? Este es el código que tengo hasta ahora:
import urllib2
import lxml.etree as etree
file = urllib2.urlopen("http://www.greenbuttondata.org/data/15MinLP_15Days.xml")
data = file.read()
file.close()
tree = etree.parse(data)
¿Sabe si es posible desactivar la carga de todos los recursos externos? Miré en la documentación pero no pude encontrar nada. – daveeloo
"* Obtiene ese error porque el XML que está cargando hace referencia a un recurso externo *". No. Esa no es la razón por la que obtienes el error. Por favor mira mi respuesta. – mzjn