¿Cómo hacer que wget IGNORE ciertos archivos?


0

¿Cómo hago que wget IGNORE ciertos archivos? Pregunto, ya que los descarga y los elimina después, ya que no son obligatorios (están excluidos). Pero, ¿existe una opción para IGNORE ellos antes incluso de comenzar a descargarlos?

Además, ¿se -Xaplica también a los archivos, al igual que a los directorios?

Ejemplo:

wget -A pdf -r -l 1 -X /ABC/,/index.html -i log.txt

¿O tener el archivo descargado y ejecutarlo con -comitirlo?


puede intentar --reject jpg, png --aceptar html, pdf
arana

@arana No, no quiero almacenar 30'000 archivos html de log.txt. Quiero almacenar 30'000 archivos pdf, pero no html. Los únicos archivos html que estoy dispuesto a almacenar son los que se repiten, y ese es /index.html. Los 30,000 archivos html individuales restantes se deben descargar, rastrear usando -r y luego eliminar.
Samuel Shifterovich

Quería usar el modificador --reject, ese era un ejemplo, puede rechazar cualquier patrón que desee y si usa --rejectregex puede rechazar archivos que especifiquen expresiones regulares.
arana

--rejectregex es para rechazar archivos por nombre y no por la extensión entonces?
Samuel Shifterovich

no, puede usar -reject para excluir por nombre, solo proporcione la lista de los nombres que no desea, rechazar-regexp es para patrones más complejos.
arana
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.