me gustaría reflejar un simple portal web protegido por contraseña a algunos datos que me gustaría mantener reflejado &-actualizada. En esencia, este sitio web es sólo un listado de directorio con los datos organizados en carpetas & Realmente no me importa acerca de mantener los archivos html otros & elementos de formato. Sin embargo, hay algunos tipos de archivos enormes que son demasiado grandes para descargar, por lo que quiero ignorarlos.página web http espejo, con exclusión de ciertos archivos
El uso de la bandera wget -m -R/--reject
casi hace lo que quiero, excepto que todos los archivos se descargan, y luego si coinciden con el distintivo -R, se eliminan.
Así es como estoy usando wget
:
wget --http-user userName --http-password password -R index.html,*tiff,*bam,*bai -m http://web.server.org/
que produce una salida como ésta, lo que confirma que un archivo excluido (index.html) (a) se descarga, y (b) a continuación, se elimina:
...
--2012-05-23 09: 38: 38-- http://web.server.org/folder/
Reutilizando conexión con web.server.org:80 existente.
petición HTTP enviada, esperando respuesta ... 401 Se requiere autorización
Reutilizando conexión existente a web.server.org:80.
HTTP solicitud enviada, la respuesta a la espera de ... 200 OK
Longitud: 2677 (2.6k) [text/html]
de verano a: `web.server.org/folder/index.html' 100% [= ================================================== ================================================== =================>] 2,677 --.- K/s en 0sFalta el encabezado de último modificado: marcas de tiempo desactivadas.
2012-05-23 09:38:39 (328 MB/s) - `web.server.org/folder/index.html' salvado [2677/2677]
Extracción web.server.org/folder /index.html ya que debe ser rechazado.
...
hay una manera de forzar wget para rechazar el archivo antes de descargarlo?
¿Hay alguna alternativa que deba considerar?
Además, ¿por qué recibo un error 401 Authorization Required
por cada archivo descargado, a pesar de proporcionar el nombre de usuario & contraseña. Es como wget
intenta conectarse sin autenticación cada vez, antes de intentar el nombre de usuario/contraseña.
gracias, Mark
Ver la solución para modificar wget de esta pregunta (duplicada): http://stackoverflow.com/questions/12704197/wget-reject-still-downloads-file – taranaki