Preguntas etiquetadas con wget

wget: utilidad de línea de comandos para descargar contenido de manera no interactiva (se puede llamar desde scripts, trabajos cron, terminales sin el soporte de X-Windows, etc.)



5
No puedo olvidarme de github, error de apretón de manos sslv3
Tenemos un script que descarga mod security de github que recientemente comenzó a fallar. Los servidores ejecutan CentOS 6 pero RHEL 6 probablemente tenga el mismo problema. El resultado es: # wget https://github.com/downloads/SpiderLabs/ModSecurity/modsecurity-apache_2.7.1.tar.gz --2014-07-22 18:49:46-- https://github.com/downloads/SpiderLabs/ModSecurity/modsecurity-apache_2.7.1.tar.gz Resolving github.com... 192.30.252.129 Connecting to github.com|192.30.252.129|:443... connected. HTTP request sent, awaiting response... 302 Found …
10 centos  wget  github 


1
Obteniendo md5 durante wget
Estoy wgetcreando archivos enormes (más de 100 GB) y luego comparo mi md5sum con la suma publicada en el repositorio. Lo creas o no, md5sumlleva una cantidad de tiempo no trivial para ejecutarse en un archivo de este tamaño, por lo que me gustaría obtener la suma en paralelo con …
10 wget  checksum 

3
¿Cómo puedo pasar el argumento almacenado en una variable a WGET?
Estoy escribiendo un script bash que usa ampliamente wget. Para definir todos los parámetros comunes en un lugar, los almaceno en variables. Aquí hay un fragmento de código: useragent='--user-agent="Mozilla/5.0 (Windows NT 6.1; WOW64; rv:27.0) Gecko/20100101 Firefox/27.0"' cookies_file="/tmp/wget-cookies.txt" save_cookies_cmd="--save-cookies $cookies_file --keep-session-cookies" load_cookies_cmd="--load-cookies $cookies_file --keep-session-cookies" function mywget { log "#!!!!!!!!!# WGET #!!!!!!!!!# …

2
Descargar archivo con nombre real por wget
Estoy tratando de descargar un archivo a través de HTTP desde un sitio web usando wget. Cuando uso: wget http://abc/geo/download/?acc=GSE48191&format=file Solo recibo un archivo llamado index.html?acc=GSE48191. Cuando uso: wget http://abc/geo/download/?acc=GSE48191&format=file -o asd.rpm Obtengo asd.rpm, pero quiero descargar con el nombre real, y no quiero cambiar manualmente el nombre del archivo …
9 filenames  wget 


3
descargar solo los primeros bytes de una página fuente
Estoy descargando la página fuente HTML de un sitio web usando el cURLcomando. El problema es que no quiero la mayoría de los contenidos en la página. Solo necesito las primeras 100 líneas de la página de origen. ¿Hay alguna manera de detener la descarga de la página después de …
9 wget  curl 


3
wget no es compatible con https
Quiero descargar https://example.comusando el wgetcomando, pero dice "protocolo no admitido / no reconocido". Intenté usar el --secure protocol=''pero eso no funciona. Descargué el archivo tar de GNU wget e intenté configurarlo, pero fallé. Aquí hay un ejemplo de lo que veo: bash-2.05$ wget https://www.facebook.com/ https://www.facebook.com/: Unknown/unsupported protocol. bash-2.05$ Hola amigos, …
9 wget  https 


2
¿Le dice a wget que no use la URL de araña que coincida con un patrón?
Quiero probar cómo se comportaría mi sitio al ser arañado. Sin embargo, quiero excluir todas las URL que contengan la palabra "página". Lo intenté: $ wget -r -R "*page*" --spider --no-check-certificate -w 1 http://mysite.com/ Se -Rsupone que la bandera rechaza el patrón de URL que contiene la palabra "página". Excepto …
8 wget  url 


2
¿Hay alguna buena herramienta además de SeleniumRC que pueda obtener páginas web que incluyan contenido post-pintado por JavaScript?
Una de las principales deficiencias curles que cada vez más páginas web tienen su contenido principal pintado por una respuesta JavaScript AJAX que ocurre después de la respuesta HTTP inicial. curlnunca recoge este contenido post-pintado. Por lo tanto, para obtener este tipo de páginas web desde la línea de comandos, …
8 wget  http  html  curl  selenium 
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.