Estoy usando urllib.urlretrieve
en Python para descargar sitios web. Aunque algunos sitios web parecen no querer que los descargue, a menos que tengan una referencia adecuada desde su propio sitio. ¿Alguien sabe de una forma en que puedo establecer una referencia en una de las bibliotecas de Python o una externa para.configuración URL de referencia en python urllib.urlretrieve
6
A
Respuesta
11
import urllib2
req = urllib2.Request('http://www.example.com/')
req.add_header('Referer', 'http://www.python.org/')
r = urllib2.urlopen(req)
adoptados de http://docs.python.org/library/urllib2.html
3
urllib
hace que sea difícil enviar encabezados arbitrarios con la solicitud; puede usar urllib2, que le permite construir y enviar un objeto Request con encabezados arbitrarios (incluyendo, por supuesto, - lamentablemente deletreado ;-) - Referer
). No ofrece urlretrieve
, pero es fácil simplemente urlopen
y copia el objeto similar al archivo resultante en el disco si lo desea (directamente, o por ejemplo, a través de las funciones shutil).
3
Además, el uso urllib2
con build_opener
se puede hacer esto:
import urllib2
opener = urllib2.build_opener()
opener.addheaders = [('Referer', 'http://www.python.org/')]
opener.open('http://www.example.com/')
Cuestiones relacionadas
- 1. Diferencia entre Python urllib.urlretrieve() y wget
- 2. Cómo atrapar el error 404 en urllib.urlretrieve
- 3. URL de referencia en php
- 4. URL Sniffing en Python
- 5. ¿Puedo cambiar una URL de referencia del servicio web en el archivo de configuración?
- 6. ¿Cómo saber si urllib.urlretrieve tiene éxito?
- 7. Configuración de la URL en una WebView
- 8. Codificación URL en python
- 9. Reparar las URL de referencia erróneas
- 10. Obtener URL actual en Python
- 11. Configuración zona horaria en Python
- 12. Comportamiento de URL en una referencia web de Visual Studio
- 13. Python asignación de referencia variable
- 14. Android -. Referencia dibujable recurso como un URL
- 15. CakePHP - configuración de base de datos basada en la URL
- 16. ¿Cómo extraes la URL de una referencia web ASP.NET desde un archivo de configuración en Visual Studio 2008?
- 17. Obtener URL de referencia - los visitantes procedentes de PayPal (HTTPS)
- 18. Determinación de la URL redirigida en Python
- 19. Comparación de URL canónica en Python?
- 20. Expresión regular URL de Gruber en Python
- 21. URL con Python 3
- 22. Django/Python Referencia de modelo circular
- 23. Cortando URL con Python
- 24. python url unquit unicode
- 25. Configuración de varios entornos (desarrollo, producción) basados en la URL
- 26. Django: use la asignación inversa de URL en la configuración
- 27. ¿Qué significa "URL de Jenkins" en la configuración?
- 28. Configuración personalizada de configuración de herramientas de Python
- 29. Configuración de la ruta URL base del iframe
- 30. ¿A qué URL JSTL debo hacer referencia en mis JSP?