2011-06-24 14 views
15

im análisis de HTML usando BeautifulSoup en Pythonelemento de extracción e insertar un espacio

no sé cómo insertar un espacio al extraer elemento de texto

este es el código:

import BeautifulSoup 
soup=BeautifulSoup.BeautifulSoup('<html>this<b>is</b>example</html>') 
print soup.text 

entonces la salida es

thisisexample

pero yo quiero insertar un espacio para esto como

sí es ejemplo

¿Cómo se inserta un espacio?

Respuesta

33

Uso getText lugar:

import BeautifulSoup 
soup=BeautifulSoup.BeautifulSoup('<html>this<b>is</b>example</html>') 

print soup.getText(separator=u' ') 
# u'this is example' 
1

Si su versión de BeautifulSoup no tiene getText entonces se podría hacer esto:

In [26]: ' '.join(soup.findAll(text=True)) 
Out[26]: u'this is example' 
Cuestiones relacionadas