¿Cómo hago que wget IGNORE ciertos archivos? Pregunto, ya que los descarga y los elimina después, ya que no son obligatorios (están excluidos). Pero, ¿existe una opción para IGNORE ellos antes incluso de comenzar a descargarlos?
Además, ¿se -X
aplica también a los archivos, al igual que a los directorios?
Ejemplo:
wget -A pdf -r -l 1 -X /ABC/,/index.html -i log.txt
¿O tener el archivo descargado y ejecutarlo con -c
omitirlo?
puede intentar --reject jpg, png --aceptar html, pdf
—
arana
@arana No, no quiero almacenar 30'000 archivos html de log.txt. Quiero almacenar 30'000 archivos pdf, pero no html. Los únicos archivos html que estoy dispuesto a almacenar son los que se repiten, y ese es /index.html. Los 30,000 archivos html individuales restantes se deben descargar, rastrear usando -r y luego eliminar.
—
Samuel Shifterovich
Quería usar el modificador --reject, ese era un ejemplo, puede rechazar cualquier patrón que desee y si usa --rejectregex puede rechazar archivos que especifiquen expresiones regulares.
—
arana
--rejectregex es para rechazar archivos por nombre y no por la extensión entonces?
—
Samuel Shifterovich
no, puede usar -reject para excluir por nombre, solo proporcione la lista de los nombres que no desea, rechazar-regexp es para patrones más complejos.
—
arana