¿Cómo descargar páginas que terminan de cierta manera con httrack?


1

Intentaba descargar ciertas páginas que terminan en una frase determinada. Revisé la documentación y no pude averiguar cómo. Si hay o no hay una manera por favor dígame y si es así cómo.

EDITAR: Digamos por ejemplo que estoy tratando de obtener estos sitios web: example.com/sdfsdfs/awrf235/sdgsdg/important_page.html example.com/sdfsasdasddfs/awrfg235/sdgsdg/important_page.html example.com/sdfsdfsdfs/awrf235g/sdsagsdg/important_page.html

Y hay 100 más de los que terminan en /important_page.html y 1000 más de otras cosas inútiles. ¿Cómo podría descargar los que terminan solo en /important_page.html?


Puede proporcionar más información. Describa más lo que está tratando de lograr (ejemplo), los obstáculos y las cosas que ha intentado hasta ahora.
Tom Ruh

En general, es el formato de lo que estás intentando raspar. example.com/RANDOM/RANDOM/important_page.html (es decir., example.com y important_page.html ¿Son fijos y las otras partes del camino pueden variar?
meatspace

Si, eso es exactamente correcto.
Ford Smith

Respuestas:


0

Ir Options / Scan Rules, haga clic Incluir enlace (s) y luego agregue una regla de escaneo para el nombre de archivo que desea hacer coincidir:

1

2
(La imagen de arriba muestra una regla de exclusión que se agrega, pero la interfaz de usuario es la misma para las reglas de inclusión).

Documentacion para filtros / reglas de escaneo y filtros avanzados .

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.