¿Cómo comparo dos mapas para determinar cuál es mejor?


10

Estoy tratando de hacer una comparación objetiva de dos mapas diferentes para la misma región. En este momento, estoy luchando con la definición de criterios que me permitan hacer una evaluación desapasionada.

¿Alguien tiene alguna idea sobre cómo hacer esto o cómo debería abordar el problema?

Como puede ver, ninguno de los dos mapas es superior, algunas brechas en el conjunto azul, algunas en el rojo.

ingrese la descripción de la imagen aquí


77
La pregunta está muy mal definida? ¿Qué quieres decir con calidad? ¿Hay presunciones sobre integridad, precisión, geometría ...? ¿Existe un tercer conjunto de datos de referencia con el cual comparar?
petzlux

Solo un pensamiento, ¿por qué no compararlos con imágenes aéreas de alta resolución? Quizás incluso convertirlos a KML y evaluar su precisión en Google Earth.
Aaron

2
@ Martin, ¿estás pidiendo un método para resaltar las diferencias geométricas de las dos capas?
artwork21

1
Hay mucha literatura sobre el tema. Algunos documentos para comenzar: underdark.wordpress.com/projects/…
underdark

1
¿Esta pregunta realmente no tiene poco que ver con la cartografía o los mapas, sino con la calidad de los datos? Quizás podría reformular su pregunta y proporcionar más contexto en el lado de la calidad de los datos.
blah238

Respuestas:


14

Esta respuesta describe un método objetivo para medir discrepancias arbitrarias entre dos conjuntos de datos espaciales. Dichas discrepancias pueden incluir cambios de posición, cambios de forma y características presentes en un conjunto de datos pero no en otro. Esta respuesta no proporciona ningún medio para determinar cuál es "mejor", porque eso depende de mucho más que solo los datos y particularmente depende de para qué se utilizarán los datos.

Antecedentes

Una buena base para un gran conjunto de tales mediciones se basa en la transformación de distancia euclidiana de cada conjunto de datos. Esto considera que cada conjunto de datos representa una colección de puntos en el plano. Llamemos a estas colecciones B para las características azules y R para las características rojas.

Para cualquier punto x en el plano, la distancia euclídea transformada de un conjunto de puntos A calcula el extremo inferior de las distancias entre x y A . Podemos pensar que esta transformación como la creación de una "superficie", cuya altura a la x es igual a la distancia más corta desde x a una . Así, esta superficie tiene valles en todos los puntos de A , donde su altura es cero, y se eleva a una 1: 1 pendiente lejos de A . Está claro que la transformación de distancia a su vez determina A (o técnicamente su cierre métrico , que para los conjuntos de datos GIS es lo mismo que A) como el conjunto de todos los puntos a una altura de cero. Por lo tanto, la transformación de distancia captura completamente toda la información espacial de A que el SIG puede representar.

Figura 1

Esta figura muestra las transformaciones de distancia de B (a la izquierda) y R (a la derecha) en pseudo relieve.

Comparar dos datsets

Para comparar B y R , superponga cada uno con la transformación de distancia del otro:

Figura 2

Los valores de distancia se muestran como colores graduados de azules (cerca de 0) a rojos.

El mapa de la izquierda, por ejemplo, muestra los puntos de B y colores de acuerdo a sus distancias de R . Los roles de B y R se cambian en el mapa correcto.

Esto ya ayuda al ojo a hacer comparaciones: cada mapa muestra los puntos de un conjunto de datos y, mediante el uso del color, enfatiza los puntos que están lejos de cualquier punto del otro conjunto de datos. Tenga en cuenta que ambos mapas son necesarios para la comparación, porque cada uno muestra puntos que no están en el otro.

En mapas detallados, el color puede ser difícil de ver, por lo que podríamos elegir difuminarlo un poco para su presentación o evaluación visual:

figura 3

NB: los colores no son comparables entre los dos mapas: dentro de cada mapa se escalan para mostrar el rango completo de distancias en ese mapa.

Análisis estadístico de las diferencias.

La belleza de este enfoque radica en lo que se puede hacer en el procesamiento posterior. Usando un ráster para representar las transformaciones de distancia y sus superposiciones, podemos obtener fácilmente estadísticas, locales y globales, para medir las discrepancias. Por ejemplo, podríamos centrarnos en todas las distancias más grandes que un umbral pequeño y explorar su distribución de frecuencia:

Figura 4

En este histograma, las barras azules son para las características azules, las barras rojas para las características rojas. (Observe la escala logarítmica en el eje horizontal). Este histograma muestra los datos superpuestos originales, no los datos borrosos derivados. Ha seleccionado solo aquellas distancias mayores de tres píxeles en la imagen original.

Estos histogramas muestran que es mucho más probable que las características azules estén lejos de las características rojas que viceversa : las barras azules son más altas que las rojas y se extienden a distancias mayores (a la derecha). Todo el arsenal de estadísticas descriptivas está ahora disponible para cuantificar las diferencias entre los dos conjuntos de datos. Estas estadísticas pueden aplicarse a toda la región de interés o "abrirse en una ventana" para explorar cómo los dos conjuntos de datos difieren según la ubicación.

Implementación

La mayoría de los SIG ráster proporcionan una transformación de distancia euclidiana (como EuclideanDistance en ArcGIS y r.grow.distance en GRASS), y todos admiten la superposición simple (enmascaramiento) necesaria para hacer este análisis. El desenfoque, si se desea, se puede hacer con una media de vecindad o convolución del núcleo (que incluye el "desenfoque gaussiano" disponible en todo el software de procesamiento de imágenes). La mayoría de GISes qué no proporcionan un soporte adecuado para el análisis estadístico completo de los datos de mapa de bits, sin embargo, pero que son buenos en la exportación de dichos datos en formatos legibles por el software estadístico y matemático como Ro Mathematica (lo que hizo que todas las figuras aquí).


Como siempre, su respuesta es una lectura fascinante, y encuentro nuevas cosas para aprender y pensar. ¿Podría decirme también cómo creó el tipo de gráfico 'dibujado a mano'?
Devdatta Tengshe

3
@Devdatta El histograma se creó en Mathematica mediante procesamiento posterior con una modificación de código en Mathica.stackexchange.com/questions/11350/xkcd-style-graphs . Ejemplos adicionales de tales gráficos están en stats.stackexchange.com/questions/49123/… y stats.stackexchange.com/questions/48973/… y stats.stackexchange.com/questions/48467/… .
whuber

4

Como se trata de un problema de validación de geometría por su aspecto, cargue las imágenes actuales y vea si puede validar las calles como existentes o como presentes. Probablemente un conjunto de datos es más nuevo y / o más completo. Descubra qué conjunto de datos tiene la mayor precisión horizontal y cuál se ha recopilado más recientemente y por qué proceso. ¿Hay alguna diferencia entre las huellas de tigre, osm, gis y gps? Las imágenes son tu amigo aquí, al menos imágenes precisas como HAIP de época reciente. El criterio puede ser, integridad, cobertura, precisión, corrección, vigencia.


1

Creo que siguiendo los comentarios y respuestas anteriores (tal vez esto también debería ser un comentario en lugar de una respuesta), pero usaría cualquier mapeo que tenga disponible para validar los archivos mediante comparación visual. Elija características donde haya datos trazados precisos disponibles ... como redes de carreteras (en Inglaterra, Escocia y Gales están disponibles gratuitamente desde OS).

Siguiendo con la sugerencia de usar google earth e imágenes. Use el complemento de capas abiertas para cargar imágenes satelitales en el fondo y comparar de nuevo.

Una gran cantidad de mapas precisos gratuitos para usar como base de comparación.


Desafortunadamente, comencé a hacer esta comparación basada en el hecho de que OSM y otros mapas OpenSource realmente no son tan precisos como parecemos pensar. ¡Pero la entrada sobre el uso de imágenes de satélite es una pista a seguir!
Styp
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.