2012-07-10 23 views
6

Duplicar posible:
Decode HTML entities in Python string?¿Cómo puedo usar Python para reemplazar caracteres de escape HTML?

que tiene una cadena completa de caracteres de escape HTML, como ", ” y —.

¿Alguna biblioteca de Python ofrece formas confiables de reemplazar todos estos caracteres de escape con sus respectivos caracteres reales?

Por ejemplo, quiero que todos " s reemplazados con "s

+0

[String.Replace] (http://docs.python.org/library/string.html#string.replace) –

+0

Uso Hermosa sopa: http: // lxml .de/elementsoup.html – sateesh

Respuesta

14

Usted desea utilizar este:.

from HTMLParser import HTMLParser 
parser = HTMLParser() 
html_decoded_string = parser.unescape(html_encoded_string) 

También estoy viendo una gran cantidad de amor por BeautifulSoup

from BeautifulSoup import BeautifulSoup 
html_decoded_string = BeautifulSoup(html_encoded_string, convertEntities=BeautifulSoup.HTML_ENTITIES) 

También duplicado de estas preguntas existentes:

Decode HTML entities in Python string?

Decoding HTML entities with Python

Decoding HTML Entities With Python

+1

Si sabe que es un duplicado, ¿por qué no marcar en lugar de responder (que no sea rep)? – kapa

+1

Es molesto cuando las personas no se toman el tiempo para buscar las respuestas existentes a sus preguntas, especialmente en este caso, cuando hay tantas réplicas exactas. Sin embargo, a veces siento que la comunidad hace overflags. ¿Qué pasaría si hubiéramos malentendido la pregunta y realmente no fuera un duplicado? ¿Qué sucede si al responder la pregunta se generó una conversación/hilo significativo que lleva la pregunta y la respuesta en una dirección diferente? Además, no se trata de la reputación, una vez que se cierra una pregunta o se borra la reputación relacionada con ella ... –

+1

Solo intenté advertirte sobre las normas de comportamiento generalmente aceptadas aquí en StackOverflow. Si pareciera que te importa un poco, buscaría la pregunta de Meta sobre esto, pero supongo que puedes encontrarlo tú mismo si estás interesado. No quiero entrar en discusiones sobre esto, solo fui el mensajero, hazlo como quieras :). – kapa

Cuestiones relacionadas