estoy usando BeautifulSoup para extraer las noticias (sólo los títulos) de Hacker News y tener esta cantidad hasta el ahora-findall BeautifulSoup con el error de clase atributo, Unicode de codificación
import urllib2
from BeautifulSoup import BeautifulSoup
HN_url = "http://news.ycombinator.com"
def get_page():
page_html = urllib2.urlopen(HN_url)
return page_html
def get_stories(content):
soup = BeautifulSoup(content)
titles_html =[]
for td in soup.findAll("td", { "class":"title" }):
titles_html += td.findAll("a")
return titles_html
print get_stories(get_page()
)
Cuando corro el código, sin embargo, da un error-
Traceback (most recent call last):
File "terminalHN.py", line 19, in <module>
print get_stories(get_page())
UnicodeEncodeError: 'ascii' codec can't encode character u'\xe2' in position 131: ordinal not in range(128)
¿Cómo hago para que funcione?
Quiere '.encode ('utf-8')' convertir de una cadena Unicode a una cadena codificada en UTF-8. – Alex