Preguntas etiquetadas con parsing

Análisis de datos (no) estructurados para convertirlos en un formato estructurado y normalizado.

5
Obtener datos de una página web de manera estable y eficiente
Recientemente he aprendido que usar una expresión regular para analizar el HTML de un sitio web para obtener los datos que necesita no es el mejor curso de acción. Entonces mi pregunta es simple: ¿Cuál es, entonces, la mejor / más eficiente y una forma generalmente estable de obtener estos …
11 data  parsing 

7
Técnicas para analizar XML
Siempre he encontrado que XML es algo engorroso de procesar. No estoy hablando de implementar un analizador XML: estoy hablando de usar un analizador basado en flujo existente, como un analizador SAX, que procesa el nodo XML por nodo. Sí, es realmente fácil aprender las diversas API para estos analizadores, …

2
Algoritmo para formatear código SQL
Necesito una herramienta (para uso interno) que formatee el código SQL (SQL Server / MySQL). Hay varias herramientas de terceros y sitios web en línea que lo hacen, pero no exactamente cómo lo necesito. Por eso quiero escribir mi propia herramienta que se ajuste a mis necesidades. Primera pregunta ¿hay …




2
Análisis de idiomas para encontrar palabras importantes
Estoy buscando información y teoría sobre cómo abordar un tema léxico. Digamos que tengo una colección de cadenas, que pueden ser solo una oración o potencialmente múltiples oraciones. Me gustaría analizar estas cadenas y extraer las palabras más importantes, tal vez con una puntuación que denote la probabilidad de que …



6
La mejor manera de analizar un archivo
Estoy tratando de encontrar una mejor solución para hacer un analizador sintáctico de algunos de los formatos de archivo famosos, como: EDIFACT y TRADACOMS . Si no está familiarizado con estos estándares, consulte este ejemplo de Wikipedia: Consulte a continuación un ejemplo de un mensaje EDIFACT utilizado para responder a …


1
comparación cuantitativa de formas AST
¿Cómo se puede comparar la forma de los árboles de sintaxis abstracta de programas de código fuente similares (C, C ++, Go o cualquier cosa compilada con GCC ...)? Supongo que la detección de plagio en el código fuente usaría tales técnicas, pero no tengo idea de cómo se llamaría …




Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.