Preguntas etiquetadas con html-parsing



9
Analizar una cadena HTML con JS
Busqué una solución pero nada era relevante, así que aquí está mi problema: Quiero analizar una cadena que contiene texto HTML. Quiero hacerlo en JavaScript. Probé esta biblioteca pero parece que analiza el HTML de mi página actual, no de una cadena. Porque cuando pruebo el siguiente código, cambia el …

18
Usar expresiones regulares para analizar HTML: ¿por qué no?
Parece que cada pregunta en stackoverflow donde el autor de la pregunta está utilizando expresiones regulares para obtener cierta información de HTML inevitablemente tendrá una "respuesta" que dice no usar expresiones regulares para analizar HTML. Por qué no? Soy consciente de que existen analizadores HTML "reales" entre comillas, como Beautiful …

3
¿Qué analizador HTML es el mejor? [cerrado]
Tal como está actualmente, esta pregunta no es adecuada para nuestro formato de preguntas y respuestas. Esperamos que las respuestas sean respaldadas por hechos, referencias o experiencia, pero esta pregunta probablemente solicitará debate, argumentos, encuestas o discusión extendida. Si cree que esta pregunta se puede mejorar y posiblemente volver a …

7
Analizando HTML usando Python
Estoy buscando un módulo HTML Parser para Python que pueda ayudarme a obtener las etiquetas en forma de listas / diccionarios / objetos de Python. Si tengo un documento de la forma: <html> <head>Heading</head> <body attr1='val1'> <div class='container'> <div id='class'>Something here</div> <div>Something else</div> </div> </body> </html> entonces debería darme una …



5
¿Cómo analizo una página HTML con Node.js?
Necesito analizar (del lado del servidor) grandes cantidades de páginas HTML. Todos estamos de acuerdo en que regexp no es el camino a seguir aquí. Me parece que javascript es la forma nativa de analizar una página HTML, pero esa suposición se basa en que el código del lado del …

8
Cómo extraer cadenas siguiendo un patrón con grep, regex o perl
Tengo un archivo que se parece a esto: <table name="content_analyzer" primary-key="id"> <type="global" /> </table> <table name="content_analyzer2" primary-key="id"> <type="global" /> </table> <table name="content_analyzer_items" primary-key="id"> <type="global" /> </table> Necesito extraer cualquier cosa entre las comillas que siguen name=, es decir content_analyzer, content_analyzer2y content_analyzer_items. Estoy haciendo esto en una caja de Linux, por …

8
¿Cómo normalizar HTML en JavaScript o jQuery?
Las etiquetas pueden tener varios atributos. El orden en que aparecen los atributos en el código no importa. Por ejemplo: <a href="#" title="#"> <a title="#" href="#"> ¿Cómo puedo "normalizar" el HTML en Javascript, para que el orden de los atributos sea siempre el mismo? No me importa qué orden se …
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.