Si utiliza la expansión de llaves con wget
, puede obtener imágenes numeradas secuencialmente con facilidad:
$ wget 'http://www.iqandreas.com/sample-images/100-100-color/'{90..110}'.jpg'
Obtiene los primeros 10 archivos numerados 90.jpg
para que 99.jpg
estén bien, pero 100.jpg
luego devuelve un error 404: Archivo no encontrado (solo tengo 100 imágenes almacenadas en el servidor). Estos archivos inexistentes se vuelven más un "problema" si usa un rango mayor, como {00..200}
, con 100 archivos inexistentes, aumenta el tiempo de ejecución del script e incluso podría convertirse en una carga ligera (o al menos molesta) en el servidor.
¿Hay alguna forma de wget
detenerse después de haber recibido su primer error 404? (o incluso mejor, dos seguidos, en caso de que falte un archivo en el rango por otra razón) La respuesta no necesita usar la expansión de llaves; los bucles también están bien.
1, 2 or even n failures
no es la forma correcta cuando sabes[begin .. end]
índices. ¿Por qué especificarías el[1..200]
rango si sabes que solo hay 100 imágenes[1..100]
? Supongo que puedes probar GNUparallel
para solicitudes simultáneas para acelerar el proceso.