Esta respuesta describe un método objetivo para medir discrepancias arbitrarias entre dos conjuntos de datos espaciales. Dichas discrepancias pueden incluir cambios de posición, cambios de forma y características presentes en un conjunto de datos pero no en otro. Esta respuesta no proporciona ningún medio para determinar cuál es "mejor", porque eso depende de mucho más que solo los datos y particularmente depende de para qué se utilizarán los datos.
Antecedentes
Una buena base para un gran conjunto de tales mediciones se basa en la transformación de distancia euclidiana de cada conjunto de datos. Esto considera que cada conjunto de datos representa una colección de puntos en el plano. Llamemos a estas colecciones B para las características azules y R para las características rojas.
Para cualquier punto x en el plano, la distancia euclídea transformada de un conjunto de puntos A calcula el extremo inferior de las distancias entre x y A . Podemos pensar que esta transformación como la creación de una "superficie", cuya altura a la x es igual a la distancia más corta desde x a una . Así, esta superficie tiene valles en todos los puntos de A , donde su altura es cero, y se eleva a una 1: 1 pendiente lejos de A . Está claro que la transformación de distancia a su vez determina A (o técnicamente su cierre métrico , que para los conjuntos de datos GIS es lo mismo que A) como el conjunto de todos los puntos a una altura de cero. Por lo tanto, la transformación de distancia captura completamente toda la información espacial de A que el SIG puede representar.
Esta figura muestra las transformaciones de distancia de B (a la izquierda) y R (a la derecha) en pseudo relieve.
Comparar dos datsets
Para comparar B y R , superponga cada uno con la transformación de distancia del otro:
Los valores de distancia se muestran como colores graduados de azules (cerca de 0) a rojos.
El mapa de la izquierda, por ejemplo, muestra los puntos de B y colores de acuerdo a sus distancias de R . Los roles de B y R se cambian en el mapa correcto.
Esto ya ayuda al ojo a hacer comparaciones: cada mapa muestra los puntos de un conjunto de datos y, mediante el uso del color, enfatiza los puntos que están lejos de cualquier punto del otro conjunto de datos. Tenga en cuenta que ambos mapas son necesarios para la comparación, porque cada uno muestra puntos que no están en el otro.
En mapas detallados, el color puede ser difícil de ver, por lo que podríamos elegir difuminarlo un poco para su presentación o evaluación visual:
NB: los colores no son comparables entre los dos mapas: dentro de cada mapa se escalan para mostrar el rango completo de distancias en ese mapa.
Análisis estadístico de las diferencias.
La belleza de este enfoque radica en lo que se puede hacer en el procesamiento posterior. Usando un ráster para representar las transformaciones de distancia y sus superposiciones, podemos obtener fácilmente estadísticas, locales y globales, para medir las discrepancias. Por ejemplo, podríamos centrarnos en todas las distancias más grandes que un umbral pequeño y explorar su distribución de frecuencia:
En este histograma, las barras azules son para las características azules, las barras rojas para las características rojas. (Observe la escala logarítmica en el eje horizontal). Este histograma muestra los datos superpuestos originales, no los datos borrosos derivados. Ha seleccionado solo aquellas distancias mayores de tres píxeles en la imagen original.
Estos histogramas muestran que es mucho más probable que las características azules estén lejos de las características rojas que viceversa : las barras azules son más altas que las rojas y se extienden a distancias mayores (a la derecha). Todo el arsenal de estadísticas descriptivas está ahora disponible para cuantificar las diferencias entre los dos conjuntos de datos. Estas estadísticas pueden aplicarse a toda la región de interés o "abrirse en una ventana" para explorar cómo los dos conjuntos de datos difieren según la ubicación.
Implementación
La mayoría de los SIG ráster proporcionan una transformación de distancia euclidiana (como EuclideanDistance en ArcGIS y r.grow.distance en GRASS), y todos admiten la superposición simple (enmascaramiento) necesaria para hacer este análisis. El desenfoque, si se desea, se puede hacer con una media de vecindad o convolución del núcleo (que incluye el "desenfoque gaussiano" disponible en todo el software de procesamiento de imágenes). La mayoría de GISes qué no proporcionan un soporte adecuado para el análisis estadístico completo de los datos de mapa de bits, sin embargo, pero que son buenos en la exportación de dichos datos en formatos legibles por el software estadístico y matemático como R
o Mathematica (lo que hizo que todas las figuras aquí).