Respuestas:
(Escribí esto como respuesta a otra publicación, que se marcó como un duplicado de esta mientras estaba componiendo; pensé que lo publicaría aquí en lugar de tirarlo. Parece que dice cosas bastante similares a las de Whuber respuesta, pero es lo suficientemente diferente como para que alguien pueda obtener algo de esta).
Una caminata aleatoria tiene la forma
Tenga en cuenta que
Por lo tanto, .
También tenga en cuenta que
En consecuencia, .
Es decir, debería ver una correlación de casi 1 porque tan pronto como comienza a , e son casi exactamente lo mismo: la diferencia relativa entre ellos tiende a ser bastante pequeña.y t y t - 1
Puede ver esto más fácilmente al trazar vs .y t - 1
Ahora podemos verlo de forma algo intuitiva: imagine que ha reducido a (como vemos en mi simulación de una caminata aleatoria con término de ruido normal estándar). Entonces estará bastante cerca de ; podría ser o podría ser pero es casi seguro que esté dentro de unas pocas unidades de . Entonces, a medida que la serie se mueve hacia arriba y hacia abajo, la gráfica de vs casi siempre se mantendrá dentro de un rango bastante estrecho de la línea ... pero a medida que crezca, los puntos cubrirán más y tramos mayores a lo largo de que - 20 y t - 20 - 22 - 18.5 - 20 y t y t - y=xty=x √línea (la extensión a lo largo de la línea crece con , pero la extensión vertical permanece más o menos constante); la correlación debe acercarse a 1.
En el contexto de su pregunta anterior , una "caminata aleatoria" es una realización de una caminata aleatoria binomial. La autocorrelación es la correlación entre el vector y el vector de los siguientes elementos .( x 0 , x 1 , … , x n - 1 )
La construcción misma de una caminata aleatoria binomial hace que cada difiera de cada en una constante. Después de correr la caminata por un tiempo, los valores de se habrán alejado del valor inicial y, por lo tanto, generalmente cubrirán un buen rango, generalmente proporcional a de longitud. Por lo tanto, el diagrama de dispersión lag-1 de los pares consistirá en puntos que se encuentran solo en las líneas , estando en promedio cerca de la línea . Los residuos estarán cerca dex 0 √ (xi,x i + 1 )y=x±1y=x±11( √. Por lo tanto, en la gran mayoría de las realizaciones, la varianza de los residuos (aproximadamente ) en comparación con la varianza de los valores (aproximadamente en el orden de ) será pequeña . Esperaríamos que sea aproximadamenteR2
Aquí hay una imagen de pasos en una caminata aleatoria (a la izquierda) y su diagrama de dispersión lag-1 (a la derecha). La codificación de colores se utiliza para ayudarlo a encontrar los puntos correspondientes en las dos parcelas. Observe que está muy cerca de en este caso.R 2 1 - 4 / n
Aquí está el R
código que produjo las imágenes.
set.seed(17)
n <- 1e3
x <- cumsum((runif(n) <= 1/2)*2-1) # Binomial random walk at x_0=0
rho <- format(cor(x[-1], x[-n]), digits=3) # Lag-1 correlation
par(mfrow=c(1,2))
plot(x, type="l", col="#e0e0e0", main="Sample Path")
points(x, pch=16, cex=0.75, col=hsv(1:n/n, .8, .8, .2))
plot(x[-n], x[-1], asp=1, pch=16, col=hsv(1:n/n, .8, .8, .2),
main="Lag-1 Scatterplot",
xlab="Current value", ylab="Next value")
mtext(bquote(rho == .(rho)))