Se IDE de lenium, una herramienta para probar, es algo que he usado para raspar la pantalla. Hay algunas cosas que no maneja bien (ventanas de Javascript.alert() y ventanas emergentes en general), pero hace su trabajo en una página activando los eventos de clic y escribiendo en los cuadros de texto. Debido a que la porción IDE se ejecuta en Firefox, no tienes que hacer toda la administración de las sesiones, etc. ya que Firefox se ocupa de ello. El IDE graba y reproduce las pruebas.
También exporta código C#, PHP, Java, etc. para compilar pruebas/raspadores compilados que se ejecutan en el servidor Selenium. Lo he hecho para más de algunas de mis secuencias de comandos de Selenium, lo que hace que almacenar datos recortados en una base de datos sea mucho más fácil.
Los scripts son bastante sencillos de escribir y modificar, y se componen de cosas como ("clickAndWait", "submitButton"). Vale la pena ver lo que describes.
personas han hecho esto con webkit, por ejemplo aquí: http://blog.motane.lu/2009/07/07/downloading-a-pages-content-with-python-and-webkit/comment-page- 1 – hoju