Tengo un site que deseo descargar usando Unix wget
. Si observa el código fuente y el contenido del archivo, contiene la sección denominada RESUMEN. Sin embargo después de emitir un comando wget como esto:Cómo habilitar 'wget' para descargar todo el contenido de HTML con Javascript
wget -O downdloadedtext.txt http://www.ncbi.nlm.nih.gov/IEB/Research/Acembly/av.cgi?db=mouse&c=gene&a=fiche&l=2610008E11Rik
El contenido de la downdloadedtext.txt
es incompleta y diferente con el código fuente de ese sitio. Por ejemplo, no contiene la sección RESUMEN. ¿Hay una manera correcta de obtener el contenido completo correctamente?
La razón por la que pregunto esto es porque quiero automatizar la descarga desde diferentes valores en ese HTML.
No entiendo. ¿Qué diferencias hay en el código fuente? ¿Y qué tiene que ver Javascript con eso? –
@Pekka: El cuerpo que contiene javascript no se descarga. Por favor, prueba y mira. – neversaint
No tengo wget a mano ahora (en una máquina con Windows). ¿El * cuerpo * real es diferente o no se están descargando los archivos js? –