Mi expresión regular no está haciendo nada en mi cadena.expresión regular de python que coincide con cualquier cosa
pitón
data = 'random\n<article stuff\n</article>random stuff'
datareg = re.sub(r'.*<article(.*)</article>.*', r'<article\1</article>', data, flags=re.MULTILINE)
print datareg
me sale
random
<article stuff
</article>random stuff
quiero
<article stuff
</article>
Aw, vamos: No [Cthulhu Parsing] (http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454) de nuevo . – pillmuncher
@pillmuncher: parece HTML mal formado para mí, así que dudo que un analizador HTML pueda trabajar con él muy fácilmente. – Blender
@Blender: creo que tienes razón. Pero la sustitución tampoco parece ser un XML válido. Me pregunto, ¿para qué necesita XML roto? – pillmuncher