2010-04-15 13 views
6

Estoy usando urllib2 para abrir una url. Ahora necesito el archivo html como una cadena. ¿Cómo hago esto?urllib2 a la cadena

+0

¿Qué quieres hacer con la cuerda cuando la obtienes? Es posible que la mejor solución no implique leer el archivo en una cadena. –

Respuesta

10

La forma más sencilla sería:

f = urllib2.urlopen("http://example.com/foo/bar") 
s = f.read() 
# s now holds the contents of the site 

Hay más información en el urllib2 docs.

urlopen() devuelve un objeto similar a un archivo, por lo que el file object methods de Python funciona.

+0

Gracias. Eso es perfecto. –

1
>>> import urllib2 
>>> s = urllib2.urlopen('http://www.google.com').read() 
>>> s 
<big long string here> 
7

En python3, se debe cambiar a urllib.request.openurl('http://www.example.com/').read().decode('utf-8').