Estoy tratando de descargar dos sitios para incluirlos en un CD:
http://boinc.berkeley.edu/trac/wiki
http://www.boinc-wiki.info
El problema que tengo es que ambos son wikis. Entonces, al descargar con, por ejemplo:
wget -r -k -np -nv -R jpg,jpeg,gif,png,tif http://www.boinc-wiki.info/
Obtengo muchos archivos porque también sigue enlaces como ...? Action = edit ...? Action = diff & version = ...
¿Alguien sabe una forma de evitar esto?
Solo quiero las páginas actuales, sin imágenes, sin diferencias, etc.
PD:
wget -r -k -np -nv -l 1 -R jpg,jpeg,png,gif,tif,pdf,ppt http://boinc.berkeley.edu/trac/wiki/TitleIndex
Esto funcionó para Berkeley pero boinc-wiki.info todavía me está dando problemas: /
PPS:
Obtuve lo que parecen ser las páginas más relevantes con:
wget -r -k -nv -l 2 -R jpg,jpeg,png,gif,tif,pdf,ppt http://www.boinc-wiki.info