wget --content-disposition 'https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE48191&format=file'
El archivo que está descargando es un tar
archivo (un archivo binario), proporcionado por un enlace dinámico desde un servidor web. wget
normalmente guardaría el archivo usando parte de la URL que está usando, pero en este caso es solo un punto final de la API REST (o algo similar), por lo que el nombre sería poco amigable para trabajar (aún sería un nombre válido y el el contenido del archivo sería el mismo).
Sin embargo, en este caso, el servidor proporciona un encabezado de "Disposición de contenido" que contiene el nombre real del archivo, que wget
puede usar si usa la --content-disposition
opción. Esta opción está marcada como "experimental" en mi manual para wget
.
También debe citar la URL para que el shell no interprete los caracteres &
y ?
.
Lo equivalente usando curl
:
curl -J -O 'https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE48191&format=file'
O, usando las opciones largas equivalentes:
curl --remote-header-name --remote-name 'https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE48191&format=file'
Una vez que haya descargado el archivo, debe descomprimirlo:
tar -xvf GSE48191_RAW.tar
Debido a la forma en que se creó este archivo en particular, esto descomprimirá los archivos del archivo en el directorio actual (por lo que puede ser una buena idea crear un nuevo directorio, mover el archivo allí y desempaquetarlo). Los archivos de este archivo son gzip
comprimido con CEL
archivos.