Supongamos que quiero que se descargue una copia simple de la página a mi HD para un mantenimiento permanente. No estoy buscando un get recursivo profundo, solo una página, sino también cualquier recurso cargado por esa página para que también se descargue.
Ejemplo: https://www.tumblr.com/
Esperar:
- El index.html
- Cualquier imagen cargada
- Cualquier archivo JS cargado
- Cualquier archivo CSS cargado
- Cualquier imagen cargada en el archivo CSS
- enlaces para los recursos de la página localizados para trabajar con las copias descargadas (sin dependencia de la web)
Me interesa saber si puede ayudarme a encontrar la mejor sintaxis de wget u otra herramienta que haga esto. Las herramientas que he probado generalmente no logran que las imágenes se carguen mediante CSS, por lo que la página nunca se ve bien cuando se carga localmente. ¡Gracias!
Solución tangente
Encontré una manera de hacer esto usando FireFox. El guardado predeterminado está roto y hay un complemento que se llama "Guardar Completo" que aparentemente puede hacer un buen trabajo con esto. Sin embargo, no puede descargarlo porque dice que no es compatible con la versión actual de FireFox. La razón es que se incluyó en este complemento: "Mozilla Archive Format". Instale eso, luego, cuando use Archivo> "Guardar página como ...", hay una nueva opción llamada "Página web completa", que es esencialmente el complemento anterior, que corrige la implementación de stock que usa Firefox (que es terrible). Esta no es una solución WGET, pero proporciona una solución viable.
EDITAR: Otro problema ridículo para cualquiera que pueda estar siguiendo esta pregunta en el futuro, tratando de hacer esto. Haga que el complemento funcione correctamente, necesita Herramientas> Formato de archivo de Mozilla y cambie la configuración predeterminada (terrible) de "tomar una instantánea fiel de la página" para "preservar los scripts y la fuente usando Guardar completa", de lo contrario el complemento vaciará todo sus archivos de script y reemplácelos con el texto "/ * Script eliminado por instantánea guardar * /".