Necesito analizar (del lado del servidor) grandes cantidades de páginas HTML.
Todos estamos de acuerdo en que regexp no es el camino a seguir aquí.
Me parece que javascript es la forma nativa de analizar una página HTML, pero esa suposición se basa en que el código del lado del servidor tiene toda la capacidad DOM que javascript tiene dentro de un navegador.
¿Node.js tiene esa capacidad incorporada?
¿Existe un mejor enfoque para este problema, analizando HTML en el lado del servidor?