2010-11-28 4 views

Respuesta

9

Puede usar Beautiful Soup. Sé que dijiste sin un módulo de terceros. Sin embargo, esta es una herramienta ideal para analizar HTML.

import urllib2 
from BeautifulSoup import BeautifulSoup 
page = BeautifulSoup(urllib2.urlopen("http://www.url.com")) 
page.findAll('img') 
+1

OK. Parece que esto lo ayudará mucho, así que lo revisaré. ¡Gracias! – user377419

+1

Creo que Russell se perdió 'BeautifulSoup (página)' –

10

sólo con PSL

from html.parser import HTMLParser 
class MyParse(HTMLParser): 
    def handle_starttag(self, tag, attrs): 
     if tag=="img": 
      print(dict(attrs)["src"]) 

h=MyParse() 
page=open("index.html").read() 
h.feed(page) 
+1

Puede aumentar esto con urllib para abrir una página web y descargar las imágenes. –

+1

Para mí esto solo funciona con "de HTMLParser import HTMLParser" – nvrandow

Cuestiones relacionadas