2011-10-24 24 views
7

Me gustaría ejecutar un rastreador que pueda manejar javascript creado html en un entorno sin un servidor X. Sé que puedo ejecutar Firefox en un estado sin cabeza en xvfb, y sé cómo instalar MozRepl en Firefox e interactuar con él usando WWW :: Mechanize cuando tengo el navegador actual y puedo descargar y configurar el módulo.Configuración de Firefox sin cabeza con MozRepl

Lo que no sé hacer es configurar MozRepl en Firefox en un entorno en el que no tengo un servidor X que me facilite la instalación del módulo. Cualquier ayuda es apreciada.

Respuesta

3

Hay un número de opciones para html + javascript sin encabezado (gracias principalmente al nuevo juguete de Google Node.js utilizado en el navegador Chrome) dependiendo del idioma que desee usar, pero desafortunadamente ninguno que conozco está basado en Firefox - - Hubo crowbar, pero parece no actualizado desde 2008.

Basar dicho software en Firefox se ha vuelto menos factible ahora que Firefox ha comenzado a integrar gecko más estrechamente con el front-end del navegador.

En cuanto a Node.js, no sé mucho acerca de las ofertas de Perl, pero aquí están algunos de los demás:

  • zombie (javascript)
  • mink (PHP 5.3) (utiliza como zombi un back-end)

Y luego hay algunas opciones no-nodo, así:

  • phantomjs (JavaScript) (utiliza un back-end webkit, que puede necesitar X instalado)
  • htmlunit (Java)
  • akephalos (rubí) (utiliza un HtmlUnit back-end)

Creo que hay también una interfaz de python para node.js (aunque si implementa un entorno de navegador, no lo sé), y es probable que también se esté trabajando en el espacio perl con el nodo.

+0

Phantomjs se ve fantástico. Gracias por el puntero –

Cuestiones relacionadas