Una de las principales deficiencias curl
es que cada vez más páginas web tienen su contenido principal pintado por una respuesta JavaScript AJAX que ocurre después de la respuesta HTTP inicial. curl
nunca recoge este contenido post-pintado.
Por lo tanto, para obtener este tipo de páginas web desde la línea de comandos, me he visto obligado a escribir scripts en Ruby que impulsan al SeleniumRC a iniciar una instancia de Firefox y luego devolver el código fuente HTML después de que se hayan completado estas llamadas AJAX.
Sería mucho mejor tener una solución de línea de comando más ágil para este tipo de problema. ¿Alguien sabe de alguno?