Con un navegador web (IE o Chrome) puedo guardar una página web (.html) con Ctl-S, inspeccionarla con cualquier editor de texto y ver los datos en formato de tabla. Quiero extraer uno de esos números, pero para muchas, muchas páginas web, demasiadas para hacerlo manualmente. Así que me gustaría usar WGET para obtener esas páginas web una tras otra, y escribir otro programa para analizar el .html y recuperar el número que quiero. Pero el archivo .html guardado por WGET cuando usa la misma URL que el navegador no contiene la tabla de datos. Por qué no? Es como si el servidor detectara que la solicitud proviene de WGET y no de un navegador web, y proporciona una página web esqueleto, que carece de la tabla de datos. ¿Cómo puedo obtener exactamente la misma página web con WGET? - ¡Gracias!
MÁS INFORMACIÓN:
Un ejemplo de la URL que estoy tratando a buscar es: http://performance.morningstar.com/fund/performance-return.action?t=ICENX®ion=usa&culture=en-US donde el ICENX cadena es un símbolo de fondos de inversión , que estaré cambiar a cualquiera de un número de diferentes símbolos de cotización. Esta descarga una tabla de datos cuando se ve en un navegador, pero la tabla de datos no se encuentra si descabellada con WGET.