Se intenta analizar el siguiente archivo de Python utilizando la función lxml.etree.iterparse.análisis de un archivo xml grande con Python - etree.parse error
"sampleoutput.xml"
<item>
<title>Item 1</title>
<desc>Description 1</desc>
</item>
<item>
<title>Item 2</title>
<desc>Description 2</desc>
</item>
probé el código de Parsing Large XML file with Python lxml and Iterparse
antes de la etree.iterparse (MIARCHIVO) llamo yo MIARCHIVO = open ("/ Users/Eric/Escritorio/wikipedia_map /sampleoutput.xml","r ")
Pero resulta el siguiente error
Traceback (most recent call last):
File "/Users/eric/Documents/Programming/Eclipse_Workspace/wikipedia_mapper/testscraper.py", line 6, in <module>
for event, elem in context :
File "iterparse.pxi", line 491, in lxml.etree.iterparse.__next__ (src/lxml/lxml.etree.c:98565)
File "iterparse.pxi", line 543, in lxml.etree.iterparse._read_more_events (src/lxml/lxml.etree.c:99086)
File "parser.pxi", line 590, in lxml.etree._raiseParseError (src/lxml/lxml.etree.c:74712)
lxml.etree.XMLSyntaxError: Extra content at the end of the document, line 5, column 1
alguna idea? ¡gracias!
Podría ser que el archivo XML es incorrecto? No contiene ninguna etiqueta ' Xml' ni un elemento raíz. – C0deH4cker
No sé lxml, pero su ejemplo no es XML válido. Un documento XML debe tener un único elemento raíz. La tuya no. –
necesita un elemento raíz, no solo nodos secundarios. – pinkdawn