Introducción y resumen
La Ley de Geografía de Tobler afirma
Todo está relacionado con todo lo demás, pero las cosas cercanas están más relacionadas que las distantes.
Kriging adopta un modelo de esas relaciones en las que
Las "cosas" son valores numéricos en ubicaciones en la superficie de la tierra (o en el espacio), generalmente representadas como un plano euclidiano.
Se supone que estos valores numéricos son realizaciones de variables aleatorias.
"Relacionado" se expresa en términos de las medias y covarianzas de estas variables aleatorias.
(Una colección de variables aleatorias asociadas con puntos en el espacio se denomina "proceso estocástico"). El variograma proporciona la información necesaria para calcular esas covarianzas.
¿Qué es Kriging?
Kriging es específicamente la predicción de cosas en lugares donde no se han observado. Para hacer que el proceso de predicción sea matemáticamente manejable, Kriging limita las posibles fórmulas para que sean funciones lineales de los valores observados. Eso hace que el problema sea finito para determinar cuáles deberían ser los coeficientes. Estos se pueden encontrar al requerir que el procedimiento de predicción tenga ciertas propiedades. Intuitivamente, una propiedad excelente es que las diferencias entre el predictor y el valor verdadero (pero desconocido) deberían tender a ser pequeñas: es decir, el predictor debería ser preciso . Otra propiedad que es muy promocionada pero que es más cuestionable es que, en promedio, el predictor debe ser igual al valor verdadero: debe ser preciso .
(La razón por la que insistir en una precisión perfecta es cuestionable, pero no necesariamente mala, es que generalmente hace que cualquier procedimiento estadístico sea menos preciso: es decir, más variable. Al disparar a un objetivo, ¿preferiría dispersar los golpes de manera uniforme alrededor del borde y rara vez golpea el centro o ¿aceptaría resultados que se enfocan justo al lado, pero no exactamente, del centro? El primero es preciso pero impreciso, mientras que el segundo es inexacto pero preciso).
Estos supuestos y criterios, es decir, las covarianzas son formas apropiadas de cuantificar la relación, que una predicción lineal funcionará y que el predictor debe ser lo más preciso posible sujeto a ser perfectamente exacto, conducen a un sistema de ecuaciones que tiene un Solución única siempre que las covarianzas se hayan especificado de manera coherente . El predictor resultante se llama "BLUP": el mejor predictor imparcial lineal.
Donde entra el Variograma
Encontrar estas ecuaciones requiere operacionalizar el programa que se acaba de describir. Esto se hace escribiendo las covarianzas entre el predictor y las observaciones consideradas como variables aleatorias. El álgebra de las covarianzas hace que las covarianzas entre los valores observados entren también en las ecuaciones de Kriging.
En este punto llegamos a un callejón sin salida, porque esas covarianzas son casi siempre desconocidas. Después de todo, en la mayoría de las aplicaciones hemos observado solo una realización de cada una de las variables aleatorias: nuestro conjunto de datos, que constituye solo un número en cada ubicación distinta. Ingrese el variograma: esta función matemática nos dice cuál debería ser la covarianza entre dos valores. Está limitado a garantizar que estas covarianzas sean "consistentes" (en el sentido de que nunca darán un conjunto de covarianzas que sean matemáticamente imposibles: no todas las colecciones de medidas numéricas de "relación" formarán matrices de covarianzas reales ). Es por eso que un variograma es esencial para Kriging.
Referencias
Debido a que la pregunta inmediata ha sido respondida, me detendré aquí. Los lectores interesados pueden aprender cómo se estiman e interpretan los variogramas consultando buenos textos como Geoestadística de Minería de Journel & Huijbregts (1978) o Geoestadística Aplicada de Isaaks & Srivastava (1989). (Tenga en cuenta que el proceso de estimación introduce dos objetos llamados "variogramas": un variograma empírico derivado de los datos y un variograma modelo que se ajusta a él. Todas las referencias al "variograma" en esta respuesta son al modelo. La llamada a vgm
la pregunta devuelve una representación por computadora de un variograma modelo.) Para un enfoque más moderno en el que la estimación de variograma y Kriging se combinen adecuadamente, vea Diggle &Geoestadística basada en modelos (2007) (que también es un manual extendido para los R
paquetes GeoR
y GeoRglm
).
Comentarios
Por cierto, ya sea que esté utilizando Kriging para la predicción o algún otro algoritmo, la caracterización cuantitativa de la relación proporcionada por el variograma es útil para evaluar cualquier procedimiento de predicción. Observe que todos los métodos de interpolación espacial son predictores desde este punto de vista, y muchos de ellos son predictores lineales, como IDW (Inverse Distance Weighted). El variograma se puede usar para evaluar el valor promedio y la dispersión (desviación estándar) de cualquiera de los métodos de interpolación. Por lo tanto, tiene una aplicabilidad más allá de su uso en Kriging.
gstat
paquete R de los mismos datos de meuse.