2011-06-12 14 views
5

Cuando estaba usando wget llegué a la página que usaba las redirecciones JS. Algo como esto:wget js redirection

<script language="JavaScript1.2"> 
var s = "i_08/0101/index.php3"; 
location.href=""+s; 
</script> 

Podría wget seguir esta redirección o hay algún otro método para resolver esto.

Respuesta

1

wget se utiliza para la descarga de la ubicación remota como está y no actúa como un navegador web, que analiza el contenido JavaScript.

Tenga en cuenta que wgethace siga los redireccionamientos de encabezado (como 301, por ejemplo).

He intentado usar lynx -source pero, por desgracia, esto dará como resultado una página web no analizada también. Una solución alternativa a este problema sería escribir un script que descargue la página, luego lo analiza y descarga posibles referencias automáticamente, pero lo dejo en tus manos.

4

Puede consultar la herramienta DHTMLGET que se creó para FAE. El objetivo de este proyecto es proporcionar js línea de base y eventos onload en la parte superior de un wget modificación:

utilidad

la dhtmlget es crear copias locales de los sitios web similares a WGET utilidad en UNIX. Admite protocolos http, https, así como la recuperación a través de proxies http. La principal diferencia entre DHTMLGET y WGET es el dhtmlget ExecuteS onload y el javascript en línea. Fue desarrollado para su uso en el Evaluador de Accesibilidad Funcional de Illinois para analizar sitios web que usan javascrpt para generar contenido para funciones de accesibilidad.

Una simple búsqueda en Google puede llevarlo a una página interesante sobre wget js feature request.