Estoy intentando obtener imágenes de Google Búsqueda de imágenes para una consulta específica. Pero la página que descargo no tiene imágenes y me redirecciona a la original de Google. Aquí está mi código:Python: la URL correcta para descargar imágenes desde la Búsqueda de imágenes de Google
AGENT_ID = "Mozilla/5.0 (X11; Linux x86_64; rv:7.0.1) Gecko/20100101 Firefox/7.0.1"
GOOGLE_URL = "https://www.google.com/images?source=hp&q={0}"
_myGooglePage = ""
def scrape(self, theQuery) :
self._myGooglePage = subprocess.check_output(["curl", "-L", "-A", self.AGENT_ID, self.GOOGLE_URL.format(urllib.quote(theQuery))], stderr=subprocess.STDOUT)
print self.GOOGLE_URL.format(urllib.quote(theQuery))
print self._myGooglePage
f = open('./../../googleimages.html', 'w')
f.write(self._myGooglePage)
¿Qué estoy haciendo mal?
Gracias
al menos tiene que cerrar el identificador de archivo –
funcionó! gracias – lorussian
@silviolor: Sé que no ayuda a su problema, pero ¿por qué no utilizar el módulo 'urllib2' incorporado de python en lugar de' curl'. – RanRag