puedo usar urllib2 para hacer peticiones HEAD así: Python HTTP HEAD: ¿trata adecuadamente los redireccionamientos?
import urllib2
request = urllib2.Request('http://example.com')
request.get_method = lambda: 'HEAD'
urllib2.urlopen(request)
El problema es que parece que cuando esto sigue redirecciones, se utiliza GET en lugar de la cabeza.
El propósito de esta solicitud HEAD es verificar el tamaño y el tipo de contenido de la URL que estoy a punto de descargar para poder asegurarme de que no descargo ningún documento enorme. (La URL es suministrada por un usuario de Internet aleatorio a través de IRC).
¿Cómo podría hacer que utilice las solicitudes HEAD cuando se siguen los redireccionamientos?
[Solicitudes] (http://docs.python-requests.org/en/latest/index.html) al menos pretende hacer esto el de manera correcta (al menos, documenta su comportamiento de redirección como que trabaja para métodos idempotentes, y llama a HEAD específicamente en los documentos). –
una solución similar: http://stackoverflow.com/questions/9890815/python-get-headers-only-using-urllib2/9892207#9892207 – newtover