¿Cómo descargar páginas que terminan de cierta manera con httrack?

Intentaba descargar ciertas páginas que terminan en una frase determinada. Revisé la documentación y no pude averiguar cómo. Si hay o no hay una manera por favor dígame y si es así cómo.

EDITAR: Digamos por ejemplo que estoy tratando de obtener estos sitios web: example.com/sdfsdfs/awrf235/sdgsdg/important_page.html example.com/sdfsasdasddfs/awrfg235/sdgsdg/important_page.html example.com/sdfsdfsdfs/awrf235g/sdsagsdg/important_page.html

Y hay 100 más de los que terminan en /important_page.html y 1000 más de otras cosas inútiles. ¿Cómo podría descargar los que terminan solo en /important_page.html?

httrack

— Ford Smith
fuente

Puede proporcionar más información. Describa más lo que está tratando de lograr (ejemplo), los obstáculos y las cosas que ha intentado hasta ahora.

— Tom Ruh

En general, es el formato de lo que estás intentando raspar. example.com/RANDOM/RANDOM/important_page.html (es decir., example.com y important_page.html ¿Son fijos y las otras partes del camino pueden variar?

— meatspace

Si, eso es exactamente correcto.

— Ford Smith

Ir Options / Scan Rules, haga clic Incluir enlace (s) y luego agregue una regla de escaneo para el nombre de archivo que desea hacer coincidir:

(La imagen de arriba muestra una regla de exclusión que se agrega, pero la interfaz de usuario es la misma para las reglas de inclusión).

Documentacion para filtros / reglas de escaneo y filtros avanzados .

— Karan
fuente