"Autocorrelación espacial" significa varias cosas para varias personas. Sin embargo, un concepto general es que un fenómeno observado en ubicaciones puede depender de manera definida de (a) covariables, (b) ubicación y (c) sus valores en ubicaciones cercanas . (Donde las definiciones técnicas varían se encuentran en el tipo de datos que se están considerando, qué "forma definida" se postula y qué significa "cercano": todos estos deben hacerse cuantitativos para poder proceder).z
Para ver lo que podría estar pasando, consideremos un ejemplo simple de un modelo espacial para describir la topografía de una región. Deje que la elevación medida en un punto sea . Un posible modelo es que depende de alguna manera matemática definida de las coordenadas de , que escribiré en esta situación bidimensional. Dejando que represente desviaciones (hipotéticamente independientes) entre las observaciones y el modelo (que, como de costumbre, se supone que tienen cero expectativas), podemos escribirzy(z)yz(z1,z2)ε
y(z)=β0+β1z1+β2z2+ε(z)
para un modelo de tendencia lineal . La tendencia lineal (representada por los y ) es una forma de capturar la idea de que los valores cercanos e , para cierran to , debería tender a estar cerca el uno del otro. Incluso podemos calcular esto considerando el valor esperado del tamaño de la diferencia entre e , . Resulta que las matemáticas son muchoβ1β2y(z)y(z′)zz′y(z)y(z′)E[|y(z)−y(z′)|]más simple si usamos una medida de diferencia ligeramente diferente: en su lugar, calculamos la diferencia al cuadrado esperada :
E[(y(z)−y(z′))2]=E[(β0+β1z1+β2z2+ε(z)−(β0+β1z′1+β2z′2+ε(z′)))2]=E[(β1(z1−z′1)+β2(z2−z2)′+ε(z)−ε(z′))2]=E[(β1(z1−z′1)+β2(z2−z2)′)2+2(β1(z1−z′1)+β2(z2−z2)′)(ε(z)−ε(z′))+(ε(z)−ε(z′))2]=(β1(z1−z′1)+β2(z2−z2)′)2+E[(ε(z)−ε(z′))2]
Este modelo no tiene ninguna autocorrelación espacial explícita, porque no contiene ningún término que relacione directamente con valores cercanos .y(z)y(z′)
Un modelo alternativo, diferente, ignora la tendencia lineal y supone solo que hay autocorrelación. Una forma de hacerlo es a través de la estructura de las desviaciones . Podríamos postular queε(z)
y(z)=β0+ε(z)
y, para tener en cuenta nuestra anticipación de correlación, asumiremos algún tipo de "estructura de covarianza" para el . Para que esto sea espacialmente significativo, asumiremos la covarianza entre y , igual a porque el tiene cero medios, tiende a disminuir a medida que y vuelven cada vez más distantes. Debido a que los detalles no importan, llamemos a esta covarianza . Esto es autocorrelación espacial.εε(z)ε(z′)E[ε(z)ε(z′)]εzz′C(z,z′) De hecho, la correlación (habitual de Pearson) entre e esy(z)y(z′)
ρ(y(z),y(z′))=C(z,z′)C(z,z)C(z′,z′)−−−−−−−−−−−−√.
En esta notación, la diferencia al cuadrado anterior esperada de 's para el primer modelo esy
E[(y(z)−y(z′))2]=(β1(z1−z′1)+β2(z2−z2)′)2+E[(ε(z)−ε(z′))2]=(β1(z1−z′1)+β2(z2−z2)′)2+C1(z,z)+C1(z′,z′)
(suponiendo ) porque se ha asumido que el en diferentes ubicaciones es independiente. He escrito lugar de para indicar que esta es la función de covarianza para el primer modelo.z≠z′εC1C
Cuando las covarianzas del no varían dramáticamente de un lugar a otro (de hecho, generalmente se supone que son constantes), esta ecuación muestra que la diferencia al cuadrado esperada en 's aumenta cuadráticamente con la separación entre y . La cantidad real de aumento está determinada por los coeficientes de tendencia y .εyzz′β0β1
Veamos cuáles son las diferencias cuadradas esperadas en las para el nuevo modelo, modelo 2:y
E[(y(z)−y(z′))2]=E[(β0+ε(z)−(β0+ε(z′)))2]=E[(ε(z)−ε(z′))2]=E[ε(z)2−2ε(z)ε(z′)+ε(z′)2]=C2(z,z)−2C2(z,z′)+C2(z′,z′).
Nuevamente, esto se comporta de la manera correcta: debido a que pensamos que debería disminuir a medida que y se separen más, la diferencia al cuadrado esperada en hecho, aumenta con la separación creciente de las ubicaciones.C2(z,z′)zz′y
La comparación de las dos expresiones para en los dos modelos nos muestra que en el primer modelo juega un papel matemáticamente idéntico a en el segundo modelo. (Hay una constante aditiva al acecho allí, enterrada en los diferentes significados de , pero no importa en este análisis.) Ergo , dependiendo del modelo, correlación espacial normalmente se representa como una combinación de una tendencia y una estructura de correlación estipulada en errores aleatorios.( β 1 ( z 1 - z ′ 1 ) + β 2 ( z 2 - z 2 ) ′ ) 2 - 2 C 2 ( z , z ′ ) C i ( z , z )E[(y(z)−y(z′))2](β1(z1−z′1)+β2(z2−z2)′)2−2C2(z,z′)Ci(z,z)
Ahora tenemos, espero, una respuesta clara a la pregunta: uno puede representar la idea detrás de la Ley de Geografía de Tobler ("todo está relacionado con todo lo demás, pero las cosas más cercanas están más relacionadas") de diferentes maneras. En algunos modelos, la Ley de Tobler se representa adecuadamente mediante la inclusión de tendencias (o términos de "deriva") que son funciones de coordenadas espaciales como la longitud y la latitud. En otros, la Ley de Tobler se captura mediante una estructura de covarianza no trivial entre términos aleatorios aditivos (elε) En la práctica, los modelos incorporan ambos métodos. El que elija dependerá de lo que desee lograr con el modelo y de su visión de cómo surge la autocorrelación espacial, ya sea que esté implícita en las tendencias subyacentes o refleje variaciones que desea considerar al azar. Ninguno de los dos siempre tiene la razón y, en cualquier problema dado, a menudo es posible usar ambos tipos de modelos para analizar los datos, comprender el fenómeno y predecir sus valores en otros lugares (interpolación).