Nuestro paquete de análisis web incluye información detallada sobre la actividad del usuario dentro de una página, y mostramos (clic/desplazamiento/interacción) visualizaciones en una superposición encima de la página web. Actualmente, este es un IFrame que contiene una representación en vivo de la página.Cómo tomar una captura de pantalla de la página HTML procesada
Dado que las páginas cambian con el tiempo, los datos anteriores ya no se corresponden con el diseño actual de la página. Nos gustaría ejecutar una araña para ocasionalmente tomar instantáneas de las páginas, lo que nos permite mantener un registro de las interacciones con varias versiones de la página.
Tenemos una implementación de trabajo de esto (Linux), pero el proceso de instantánea es un espantoso hack de Python/JavaScript/HTML que abre una ventana de Firefox, captura de pantalla y desplazamiento y fusión y guardado en un archivo. Esto requiere que instalemos la pila X en nuestros servidores normalmente sin cabeza, y tarda más de un minuto por página.
Preferiríamos una implementación sin cabezales con un rendimiento más cercano al tiempo de renderización en un navegador web normal, pero no hemos encontrado nada.
Hay un cierto movimiento hacia la creación de algo usando la fuente de Mozilla como punto de partida, pero eso me parece excesivo, así como una pesadilla de mantenimiento si intentamos mantenerlo actualizado.
Sugerencias?
utilizo [wkhtmltopdf] (http://code.google.com/p/wkhtmltopdf/) para esto. Necesita un servidor X, pero Xvfb es suficiente, por lo que técnicamente no tiene cabeza. – jrockway