Estoy familiarizado con BeautifulSoup y urllib2 para raspar datos de una página web. Sin embargo, ¿qué pasa si un parámetro debe ingresarse en la página antes de que se devuelva el resultado que quiero raspar?¿Cómo puedo ingresar datos en una página web para raspar la salida resultante usando Python?
estoy tratando de obtener la distancia geográfica entre dos direcciones que utilizan este sitio: http://www.freemaptools.com/how-far-is-it-between.htm
Quiero ser capaz de ir a la página, introducir dos direcciones, haga clic en "Mostrar", y luego extraer el " Distancia como el Cuervo vuela "y" Distancia por transporte terrestre "valores y guardarlos en un diccionario.
¿Hay alguna forma de ingresar datos en una página web usando Python?
Esto no responde su pregunta, sino su problema.Usé una extensión de Firefox llamada HttpFox para averiguar qué hizo el sitio web para calcular la distancia y resulta que usa la API de Google Maps. Puedes usarlo gratis; Consulte: http://code.google.com/apis/maps/documentation/directions/. Por ejemplo, ejecute lo siguiente en un intérprete de comandos de shell en Linux para obtener las instrucciones de JSON: curl "http://maps.googleapis.com/maps/api/directions/json?origin=london&destination=bristol&sensor=false" –