2009-04-17 16 views

Respuesta

36

Este módulo ayudará a hacer lo que usted describe:

http://www.freewisdom.org/projects/python-markdown/Using_as_a_Module

Una vez que haya convertido la reducción del precio a HTML, se puede utilizar un analizador de HTML que se deben eliminar del texto plano.

Su código podría ser algo como esto:

from BeautifulSoup import BeautifulSoup 
from markdown import markdown 

html = markdown(some_html_string) 
text = ''.join(BeautifulSoup(html).findAll(text=True)) 
+1

parece que se convierte a html .. Necesito convertir a texto sin formato .. como stackoverflow, en el resumen de preguntas de la página de inicio, elimina el formato – Krish

+0

He actualizado mi respuesta para obtener texto sin formato –

+0

Gracias coonj .. Es bueno saber sobre BeatifulSoup – Krish

2

comentado y que eliminarlo porque finalmente creo ver el problema aquí: Puede ser más fácil de convertir el texto de reducción del precio a HTML y quitar HTML del texto . No conozco nada para eliminar el descuento del texto de manera efectiva, pero hay muchas soluciones HTML a texto sin formato.

Cuestiones relacionadas