Quiero raspar el html generado por javascript, al igual que lo que se puede ver en Firebug.cómo raspar html generado por javascript usando python?
ACTUALIZACIÓN: he encontrado este artículo: http://blog.motane.lu/2009/07/07/downloading-a-pages-content-with-python-and-webkit/ que utilizan PyQt para resolver el problema y funciona bien para mí.
Sin embargo, otro problema ocurra: Tengo que iniciar sesión en el sitio web en primer lugar, pero no saben cómo simular inicio de sesión en PyQt .... :(
He visto este artículo ayer. Pero parece que el usuario tiene que abrir un navegador web para raspar la página, y eso no es lo que quiero ... Gracias de todos modos. – wong2
Es posible (no es fácil pero posible) ejecutar, por ejemplo, Firefox en un modo sin cabeza. –