2012-06-12 43 views
8

Estoy tratando de descargar un archivo de un sitio web usando python y mechanize. Mi código actual inicia sesión exitosamente en el sitio web y abre la página que contiene el enlace de descarga.Descarga de archivos con Python mechanize

El enlace de descarga es: https://www.lendingclub.com/browse/browseNotesRawDataV2.action

La información para el enlace es:

Link(base_url='https://www.lendingclub.com/browse/browse.action', url='/browse/browseNotesRawDataV2.action', text='', tag='a', attrs=[('class', 'master_pngfix'), ('id', 'browseDownloadAllLink'), ('href', '/browse/browseNotesRawDataV2.action')]) 

uso el método follow_link que hacer clic en el enlace:

br = mechanize.Browser() 
br.follow_link(url='/browse/browseNotesRawDataV2.action') 

Sin embargo, no pasa nada y no se descarga ningún archivo. Cuando abro el enlace en mi navegador cuando estoy conectado, se detiene por unos segundos y descarga el archivo.

¿Cómo puedo descargar el archivo usando Python?

+2

¿Se habilita el registro? ¿Algo que hayas visto allí? ¿Intentó "recuperar" en lugar de seguir_vínculo? – niko

+0

¿Cómo se habilita el registro? Estoy usando Eclipse en un Mac. Intenté recuperar y no pasó nada. ¿Hay alguna forma de indicar un nombre de archivo para guardar como? – user1137778

+1

Puede activar el registro con 'registro de importación; logging.basicConfig (level = logging.DEBUG) ' –

Respuesta

28

Para cualquiera que esté interesado, esta era la solución:

br.retrieve('https://www.lendingclub.com/browse/browseNotesRawDataV2.action','l‌​oans.csv')[0] 
Cuestiones relacionadas