El sitio que estoy tratando de araña es el uso de la javascript:¿Cómo obtengo el mecanismo de Python para PUBLICAR una solicitud de AJAX?
request.open("POST", url, true);
para tirar en la información extra sobre ajax que necesito a la araña. He intentado varias permutaciones de:
r = mechanize.urlopen("https://site.tld/dir/" + url, urllib.urlencode({'none' : 'none'}))
para obtener Mechanize para obtener la página, pero siempre resulta en conseguirme el código HTML de inicio de sesión de nuevo, lo que indica que algo está mal. Parece que Firefox no agrega ningún dato HTTP al POST de acuerdo con Firebug, y estoy agregando un campo vacío para intentar forzar al urlopen a usar "POST" en lugar de "GET" esperando que el sitio ignore el campo. Pensé que los permisos de instalación de Mechanize incluyen cookies. Pero al ser HTTPS es difícil wirehark la transacción para depurar.
¿Hay una manera mejor?
También parece que no hay documentación API decente para Mechanize, solo ejemplos. Esto es molesto
¿Cómo lo coloca el espacio en el modo POST? ¿No son solo los datos, o se define como un espacio de mecanizado? – brainysmurf
@brainysmurf Sin el espacio es una solicitud GET, pero al suministrar datos se cambia a una solicitud POST, y un espacio es el "dato" más simple que podría proporcionar. No hay nada especial sobre el espacio per se. – fret