12
Estoy escribiendo un script que edita un archivo XML con BeautifulStoneSoup
, pero la biblioteca convierte todas las etiquetas en minúsculas. ¿Hay una opción para conservar el caso?¿Cómo mantener las etiquetas sensibles a mayúsculas y minúsculas en BeautifulSoup.BeautifulStoneSoup?
import BeautifulSoup
xml = "<TestTag>a string</TestTag>"
soup = BeautifulSoup.BeautifulStoneSoup(xml, markupMassage=False)
print soup.prettify() # or soup.renderContents()
#prints
>>> <testtag>a string</testtag>
#instead of the expected
>>> <TestTag>a string</TestTag>
Gracias, hizo la actualización y funciona muy bien. Para futuros lectores: ejecute 'pip install BeautifulSoup4' no' pip install beautifulsoup --upgrade' – TankorSmash
Vale la pena mencionar que requiere la librería 'xml', no' lxml', que es lo que recomienda beautifulsoup si lo ejecuta sin ninguna especificación. 'lxml' no mantiene el caso. –
@KeithSmiley: Sí, cuando se usa 'soup = BeautifulSoup (xml," lxml ")', se usa el analizador HTML de lxml. Ver http://www.crummy.com/software/BeautifulSoup/bs4/doc/#installing-a-parser. – mzjn