Evaluación de las opciones.
Las líneas de contorno representan superficies continuas, por lo que su comparación es, en última instancia, un proxy para comparar esas superficies. Debido a que tanto los valores de la superficie (elevaciones) como las ubicaciones están potencialmente sujetos a errores, la comparación tiene dos componentes: en términos de valor y en términos de posición. Los dos no se pueden separar, porque los cambios en la posición de la representación de la superficie crean cambios aparentes en la elevación.
Esto nos deja con dos estrategias: comparar valores o comparar posiciones. Comparar valores es directo y directo, como mostraré, mientras que comparar posiciones de entidades lineales es problemático (como cualquiera puede apreciar dibujando dos arcos no coincidentes y desconcertando cómo medir su discrepancia).
También hay (al menos) dos estrategias para representar las superficies, como se sugiere en la pregunta: podemos apegarnos a las líneas de contorno, lo que nos coloca en la difícil posición de comparar entidades lineales entre sí; podemos convertir líneas de contorno en superficies y comparar esas superficies directamente, lo cual es atractivo pero adolece de los elementos arbitrarios del procedimiento de interpolación utilizado para reconstruir las superficies; o podemos aprovechar al máximo los datos que tenemos, mientras que tenemos que renunciar a hacer comparaciones en cualquier ubicación, excepto a lo largo de las líneas de contorno. Este último, una vez más, es directo y libre de elementos arbitrarios.
Comparación directa de curvas de nivel con una superficie.
Para comparar un contorno con una superficie, simplemente recogemos todos los valores de superficie a lo largo de ese contorno. Si el contorno es exacto, esos valores formarán un "perfil" perfectamente horizontal e invariable precisamente en la elevación nombrada por el contorno. Por lo tanto, toda la cuantificación de la diferencia se reduce a un análisis estadístico de estos perfiles.
Tal análisis podría ser rico y extenso; hay mucho que decir sobre eso que cabe en este espacio. Retrocederé, entonces, y limitaré esta respuesta a algunos análisis preliminares simples pero efectivos basados en resumir los perfiles a lo largo de los contornos. Dichos resúmenes se llevan a cabo fácilmente utilizando estadísticas zonales (que es una operación disponible en la mayoría de los SIG ráster como GRASS y Spatial Analyst). Los contornos individuales son las zonas. Los valores de la superficie debajo de esos contornos son los valores que se resumen.
Estamos principalmente interesados en dos aspectos de estos resúmenes: cantidad de variación , que puede cuantificarse por la desviación estándar y los extremos (mínimo y máximo); y valor promedio, que puede cuantificarse por la media aritmética.
Caso de estudio
A modo de ejemplo, aquí hay un DEG USGS sombreado de 7,5 minutos (tamaño de celda de 30 metros) con contornos de 50 metros calculados a partir del propio DEM :
Convertí estos contornos en un ráster (usando el mismo tamaño de celda, origen y extensión que el DEM original) y atribuí esa cuadrícula con los valores de contorno: estos sirven como identificadores de zona en el resumen zonal del DEM. Los resultados son suficientemente interesantes para garantizar la reproducción completa aquí:
Elevation Count Mean SD Min Max
100 2881 100.5 4.3 82 124
150 28333 150.0 1.9 139 170
200 46460 200.0 2.2 185 216
250 30503 250.0 2.9 236 263
300 21179 300.0 3.8 279 317
350 15709 350.0 4.3 331 369
400 13082 400.0 4.3 383 418
450 10332 450.0 4.4 436 466
500 7805 500.0 4.3 481 521
550 5493 550.0 4.4 536 566
600 3785 600.0 4.6 587 614
650 3206 649.9 4.5 637 664
700 2516 700.1 4.4 686 713
750 1859 749.9 4.2 734 764
800 1286 800.0 4.0 786 813
850 705 850.0 3.5 840 859
900 222 900.1 3.1 891 909
950 48 949.8 1.8 945 953
Tenga en cuenta que este es un resumen de los contornos generados a partir del ráster. Por lo tanto, refleja un ideal y una referencia para todas las demás comparaciones. A la luz de esto, es digno de mención que
Los valores medios del DEM ( Mean
) coinciden estrechamente con los niveles de contorno nominales ( Elevation
).
Sin embargo, hay variación : las desviaciones estándar ( SD
) tienden a ser de alrededor de 4 metros. Esto es relativamente pequeño en comparación con el intervalo de contorno de 50 metros, pero (presumiblemente) si hubiéramos elegido, por ejemplo, un intervalo de contorno de 10 metros, entonces, debido a que los contornos en sí mismos no cambiarían, estas desviaciones estándar serían de un tamaño comparable al intervalo de contorno en sí! ¿Que esta pasando aqui?
La variación puede ser grande : los extremos ( Max
y Min
) pueden desviarse de las elevaciones nominales hasta 24 metros, la mitad del intervalo de contorno. ¿Cómo es esto posible?
Los contornos cubren cantidades dramáticamente diferentes de territorio . En este terreno, los contornos de alta elevación comprenden una pequeña fracción del ráster (como se muestra en el recuento celular Count
). El contorno más bajo cubre de manera similar un número relativamente pequeño de células. Esto es típico de cualquier superficie: no puede haber abundancia de cimas de montañas y fondos de valles; la mayor parte de la tierra estará en el medio.
La explicación común para toda esta variación es, por supuesto, la pendiente . Los resúmenes zonales describen las celdas a través de las cuales pasan las líneas de contorno. Las líneas de contorno se han interpolado (groseramente) en función de las elevaciones registradas solo en los centros celulares. Donde la pendiente es empinada, las elevaciones reales debajo de las líneas interpoladas variarán mucho. Sin embargo, debido a que los contornos se construyen a intervalos de 50 metros, sería un error que la variación exceda 50/2 = 25 metros, ya que eso mostraría que el contorno simplemente estaba en el lugar equivocado. Eso limita las excursiones mínimas y máximas en los resúmenes zonales.
La siguiente figura proporciona un resumen visual de la Elevation
, Mean
y Count
valores: muestra cómo el medio de elevación de error de la trama ( Mean
menos Elevation
) varía con la elevación del contorno nominal, el tamaño de los símbolos circulares en proporción a la cantidad de terreno cubierto por cada nivel de contorno. Los círculos se hacen huecos para permitirnos verlos claramente incluso donde se superponen.
Este análisis se puede realizar con cualquier ráster. Hágalo: eso proporciona la referencia para todas las comparaciones posteriores. A continuación, realice el mismo análisis para cualquier capa de contorno que desee y compare los resultados con la referencia.
Para ilustrar y comprender este procedimiento, creé algunas capas de contorno adicionales, de la siguiente manera. Las ilustraciones se basan en una pequeña parte del DEM original para que pueda ver los detalles.
La resolución de la trama se redujo en un factor de 10 (de 30 metros a 300 metros) y luego se contorneó. Llame a esto la capa de contorno "remuestreada" . En la figura, como referencia, están los contornos originales en escala de grises.
Todos los contornos originales se desplazaron 150 metros al este y 150 metros al norte. Esta es la capa de contorno "desplazada" .
Se agregó un error de elevación aleatorio al DEM original y se recontutó. El error estuvo altamente correlacionado espacialmente y varió de -35 metros a +20 metros, con un promedio de aproximadamente cero metros. (Esto es realista y consistente con la cantidad de error esperado dentro de este DEM.) Por lo tanto, donde el error es negativo (se muestra como azul en la siguiente figura), la elevación se redujo y donde el error es positivo (amarillo en la figura ), se elevó la elevación . Esta figura muestra los contornos resultantes (para la capa "error" ). Algunos están en posiciones notablemente diferentes a los originales:
Las gráficas de los medios zonales se superponen para una fácil comparación en la siguiente figura.
Aquí se puede decir mucho, pero la verdadera sorpresa para mí fue la medida en que el simple cambio de los contornos (en una cantidad relativamente pequeña) introdujo algunos de los errores más grandes, especialmente en las elevaciones medias. (En las elevaciones más altas sabemos que un cambio nos condenará, porque está obligado a colocar los contornos más altos en las regiones de elevación más bajas en promedio, por lo que sabemos que la media zonal será menor que el nivel de contorno nominal). Del mismo modo, el cambio debería conducir a errores promedio positivos para los niveles de contorno más bajos, lo que hace, pero no en la misma medida.
Debido a que los contornos muestreados también son contornos válidos del mismo ráster, aunque con resolución reducida, entonces, como los originales, no deberían tener ningún error en promedio. Este es el caso, como lo muestran los círculos negros. Sin embargo, los círculos negros se desvían del valor ideal de cero hasta varios metros, especialmente en las elevaciones más altas: una resolución más baja conduce a una mayor variación. No es de extrañar, pero ahora hemos cuantificado el efecto para nuestro terreno particular.
Los círculos verdes, que representan un error medio para los contornos basados en elevaciones erróneas, exhiben una tendencia sistemática y consistente. que sucedeque la tendencia es al alza Eso es pura casualidad, y es el resultado de la correlación espacial de largo alcance: el error de elevación resultó ser positivo principalmente en las áreas de mayor elevación. En otras circunstancias, los errores pueden ser generalmente negativos o, si no hay una alta correlación espacial, pueden equilibrarse y ser indistinguibles a este respecto de los contornos originales. Si queremos poder identificar dicho error, tendríamos que ir más allá y estudiar cómo varía el promedio de una parte del mapa a la otra. (Podríamos hacer esto agrupando los contornos en zonas separadas o incluso cortando artificialmente los contornos en piezas más pequeñas para las zonas).
Otras continuaciones naturales de este análisis incluirían el trazado de las desviaciones estándar zonales; haciendo mapas de los errores; y quizás trazando perfiles individuales a lo largo de los contornos.
Resumen
Esta respuesta aboga por una comparación directa de las capas de contorno contra un conjunto de datos ráster mediante resúmenes zonales. Las visualizaciones y resúmenes estadísticos de las estadísticas zonales basadas en contornos derivados del ráster proporcionan una referencia para la comparación. Se puede obtener información adicional sobre lo que podría salir mal, en términos de pérdida de resolución, errores de posición y errores de elevación, introduciendo tales errores y analizando los contornos resultantes. Debido a que es probable que los resultados sean específicos del terreno en sí, soy reacio a tratar de proporcionar generalizaciones u orientación universal más allá de esto.