Estoy implementando un sitio de reemplazo para un cliente pero no quieren que todas sus páginas anteriores finalicen en 404s. Mantener la antigua estructura de URL no fue posible porque era horrible.Obtenga una lista de URL de un sitio
Así que estoy escribiendo un controlador 404 que debe buscar una página anterior solicitada y hacer un redireccionamiento permanente a la página nueva. El problema es que necesito una lista de todas las URL de página antiguas.
Podría hacerlo manualmente, pero me interesaría si hay alguna aplicación que me proporcione una lista de URL relativas (por ejemplo:/página/ruta, no http: /.../ página/ruta) acaba de dar la página de inicio. Como una araña pero a la que no le importa el contenido más que para encontrar páginas más profundas.
http://superuser.com/questions/329736/wget-recursively-retrieve-urls-from-specific-website –