¿Alguien puede explicar la función de autocorrelación en una serie de datos? Aplicando acf a los datos, ¿cuál sería la aplicación?
¿Alguien puede explicar la función de autocorrelación en una serie de datos? Aplicando acf a los datos, ¿cuál sería la aplicación?
Respuestas:
A diferencia de los datos de muestreo regulares, los datos de series temporales están ordenados. Por lo tanto, hay información adicional sobre su muestra que podría aprovechar, si hay patrones temporales útiles. La función de autocorrelación es una de las herramientas utilizadas para encontrar patrones en los datos. Específicamente, la función de autocorrelación le dice la correlación entre puntos separados por varios retrasos de tiempo. Como ejemplo, aquí hay algunos valores posibles de la función acf para una serie con períodos de tiempo discretos:
La notación es ACF (n = número de períodos de tiempo entre puntos) = correlación entre puntos separados por n períodos de tiempo. Daré ejemplos de los primeros valores de n.
ACF (0) = 1 (todos los datos están perfectamente correlacionados con ellos mismos), ACF (1) =. 9 (la correlación entre un punto y el siguiente punto es 0.9), ACF (2) =. 4 (la correlación entre un punto y un punto dos pasos por delante es 0.4) ... etc.
Entonces, el ACF le dice cuán correlacionados están los puntos entre sí, en función de cuántos pasos de tiempo están separados. Esa es la esencia de la autocorrelación, es cómo están correlacionados los puntos de datos pasados con los puntos de datos futuros, para diferentes valores de la separación de tiempo. Por lo general, es de esperar que la función de autocorrelación caiga hacia 0 a medida que los puntos se separan más (es decir, n se vuelve grande en la notación anterior) porque generalmente es más difícil pronosticar más en el futuro a partir de un conjunto de datos dado. Esto no es una regla, pero es típico.
Ahora, a la segunda parte ... ¿por qué nos importa? La ACF y su función hermana, la parcialLa función de autocorrelación (más sobre esto en un bit), se utiliza en el enfoque de modelado Box-Jenkins / ARIMA para determinar cómo se relacionan los puntos de datos pasados y futuros en una serie de tiempo. La función de autocorrelación parcial (PACF) puede considerarse como la correlación entre dos puntos que están separados por cierto número de períodos n, PERO con el efecto de las correlaciones intermedias eliminadas. Esto es importante porque digamos que, en realidad, cada punto de datos solo está directamente relacionado con el punto de datos SIGUIENTE, y ninguno otro. Sin embargo, APARECERÁ como si el punto actual estuviera correlacionado con otros puntos en el futuro, pero solo debido a un efecto de tipo "reacción en cadena", es decir, T1 está directamente correlacionado con T2 que está directamente correlacionado con T3, por lo que se ve como T1 está directamente correlacionado con T3. El PACF eliminará la correlación que interviene con T2 para que pueda discernir mejor los patrones. Una buena introducción a esto esaquí.
El manual NIST Engineering Statistics, en línea, también tiene un capítulo sobre este y un ejemplo de análisis de series de tiempo utilizando autocorrelación y autocorrelación parcial. No lo reproduciré aquí, pero revíselo y debería tener una mejor comprensión de la autocorrelación.
déjame darte otra perspectiva.
trazar los valores rezagados de una serie de tiempo con los valores actuales de la serie de tiempo.
Si el gráfico que ve es lineal, significa que existe una dependencia lineal entre los valores actuales de la serie temporal y los valores rezagados de la serie temporal.
Los valores de autocorrelación son la forma más obvia de medir la linealidad de esa dependencia.