Quiero obtener todos los archivos de un sitio web determinado en archive.org. Las razones pueden incluir:
- el autor original no archivó su propio sitio web y ahora está fuera de línea, quiero hacer un caché público a partir de él
- Soy el autor original de algún sitio web y perdí parte del contenido. Quiero recuperarlo
- ...
Cómo puedo hacer eso ?
Teniendo en cuenta que la máquina de retroceso archive.org es muy especial: los enlaces de las páginas web no apuntan al archivo en sí, sino a una página web que podría no estar allí. JavaScript se usa del lado del cliente para actualizar los enlaces, pero un truco como un wget recursivo no funcionará.
gem install wayback_machine_downloader
. Ejecute wayback_machine_downloader con la URL base del sitio web que desea recuperar como parámetro:wayback_machine_downloader http://example.com
Más información: github.com/hartator/wayback_machine_downloader