2009-10-17 20 views
59

A menudo necesito descargar una página web y luego editarla sin conexión. He intentado algunas herramientas y la principal característica que les falta es descargar imágenes a las que se hace referencia en los archivos CSS.página web y dependencias de descarga, incluidas las imágenes CSS

¿Hay alguna herramienta (para Linux) que descargue todo para que la página web muestre lo mismo sin conexión (excluyendo AJAX)?

+0

Esto funcionó para mí el mejor :::::::::::: wget --no-clobber --page-requisites --html-extension --convert-links --restrict-file-names = windows --no-parent http://example.com/ – rsharpy

Respuesta

79
wget --page-requisites http://example.com/your/page.html 

This option provoca Wget para descargar todos los archivos que son necesarios para visualizar correctamente una página HTML dada. Esto incluye cosas tales como imágenes en línea, sonidos y hojas de estilo referenciadas.

EDIT: meder is right: stock wget no analiza y descarga las imágenes de css. Hay, sin embargo, un parche que añade esta característica: [1, 2]

ACTUALIZACIÓN: El parche mencionado anteriormente has been merged into wget 1.12, publicado el 22-Sep-2009:

** Added support for CSS. This includes: 
- Parsing links from CSS files, and from CSS content found in HTML 
    style tags and attributes. 
- Supporting conversion of links found within CSS content, when 
    --convert-links is specified. 
- Ensuring that CSS files end in the ".css" filename extension, 
    when --convert-links is specified. 
+3

Hasta donde yo sé, esto no descargará imágenes referenciadas en archivos CSS, que es lo que el OP pretendía. Creo que tendrías que escribir un script que analizara los archivos css o encontrara uno creado por alguien, pero tengo curiosidad acerca de esto también. –

+0

Debe descargar todo el directorio de imágenes recursivamente – OscarRyz

+0

parece que el parche ha estado presente desde 07, y aún no está integrado ... – hoju

6

me encontré con el mismo problema el otro día trabajando para un cliente. Otra herramienta que funciona realmente bien es HTTrack. El software está disponible en una versión de línea de comandos para Windows y Linux. Para Linux precompilaron paquetes para la mayoría de los sistemas operativos más comunes encontrados here

Para mis propósitos funcionó mejor que wget con algunas de las funciones/modificadores adicionales que arreglan enlaces dentro del archivo html.

+0

¿Qué sintaxis usas para esta tarea? –

+0

La documentación bastante completa está aquí [link] (http://www.httrack.com/html/shelldoc.html) No recuerdo la configuración exacta que utilicé, pero probé un par de combinaciones diferentes para obtener lo que necesitaba. –

+0

@EveretteMills que lo que estaba buscando gracias –

9

Es posible hacer esto a través de Firefox, consulta esta forma

  1. clic derecho
  2. Ver las páginas de información
  3. ficha Seleccionar medios
  4. Resalte todos los archivos
  5. Guardar como

Referencia - http://www.webdeveloper.com/forum/showthread.php?t=212610

+5

Esto no ayuda cuando se trata de guardar archivos css o js –

+3

no obtiene CSS, que fue especificado por el Op. Aunque es un truco/proceso genial. No lo hubiera pensado yo mismo. Gracias por publicar. – BishopZ

+1

Me funcionó, guardé todos los PNG usados ​​a través de CSS, muchas gracias. – user9349193413

8

wget es una gran opción para usted. Solo para obtener más información, la versión de wget en Windows en este momento no hay un lanzamiento oficial en gnu para la versión 1.12 de wget. La versión actual es 1.11

wget versión 1.11 no puede descargar imágenes/fuentes en archivos css. Afortunadamente, puedes encontrar una compilación de 1.14 desde esta página. Solucionó estos problemas.

http://opensourcepack.blogspot.com/2010/05/wget-112-for-windows.html

+2

+1 por dejarnos saber que no había una versión de Windows '1.12' –

2

En Firefox:

Archivo-> Guardar página As-> Página Web, completa

Guarda todas las imágenes y Javascript y CSS.No se requiere nada más :)

+3

Desafortunadamente, este método no descargará las imágenes a las que se hace referencia dentro de los archivos CSS (en la última versión de FF 21 o inferior). – sgnsajgon

3

La versión actual de Opera (12) permite guardar una página como 'HTML con imágenes'.

Thereby Opera también descarga imágenes a las que se hace referencia en los archivos CSS y adapta las URL de las imágenes en el CSS correspondiente.

+0

Funcionó perfectamente donde otras opciones fallaron. –

Cuestiones relacionadas