¿Cómo identifica ACF y PACF el orden de los términos MA y AR?


12

Han pasado más de 2 años que estoy trabajando en diferentes series de tiempo. He leído en muchos artículos que ACF se usa para identificar el orden del término MA y PACF para AR. Hay una regla general para MA, el retraso donde ACF se apaga repentinamente es el orden de MA y de manera similar para PACF y AR.

Aquí está uno de los artículos que seguí de PennState Eberly College of Science.

Mi pregunta es ¿por qué es así? Para mí, incluso ACF puede dar término AR. Necesito una explicación de la regla del pulgar mencionada anteriormente. No puedo entender la regla del pulgar de forma intuitiva / matemática por eso:

La identificación de un modelo AR a menudo se realiza mejor con el PACF.
La identificación de un modelo de MA a menudo se realiza mejor con el ACF en lugar del PACF

Tenga en cuenta: - No necesito cómo sino "POR QUÉ". :)

Respuestas:


9

Las citas son del enlace en el OP:

La identificación de un modelo AR a menudo se realiza mejor con el PACF.

Para un modelo AR, el PACF teórico se "apaga" más allá del orden del modelo. La frase "se apaga" significa que, en teoría, las autocorrelaciones parciales son iguales a 0 más allá de ese punto. Dicho de otra manera, el número de autocorrelaciones parciales distintas de cero da el orden del modelo AR. Por "orden del modelo" nos referimos al retraso más extremo de x que se utiliza como predictor.

... una autorregresión de orden , escrita como AR (k), es una regresión lineal múltiple en la que el valor de la serie en cualquier momento t es una función (lineal) de los valores en ocasionesktht1,t2,,tk:

yt=β0+β1yt1+β2yt2++β2ytk+ϵt.

Esta ecuación parece un modelo de regresión, como se indica en la página vinculada ... Entonces, ¿cuál es una posible intuición de lo que estamos haciendo ...

En susurros chinos o en el juego telefónico como se ilustra aquí

ingrese la descripción de la imagen aquí

el mensaje se distorsiona a medida que se susurra de persona a persona, y todos los rastros de semejanza (cualquier palabra veraz, si se quiere) se pierden después del participante rojo (con la excepción del artículo 'a'). PACF nos diría que los coeficientes para los participantes azul y amarillo no son contributivos una vez que se tiene en cuenta el efecto de los participantes marrón y rojo (el participante verde al final de la línea no distorsiona el mensaje).

No es difícil acercarse mucho a la salida real de la función R al obtener regresiones OLS consecutivas a través del origen de secuencias rezagadas más lejanas, y recolectar los coeficientes en un vector. Esquemáticamente

ingrese la descripción de la imagen aquí

un proceso muy similar al juego telefónico: llegará un momento en que no habrá ninguna variabilidad en la señal de la serie de tiempo inicial real que se encuentra en fragmentos progresivamente más distantes de sí misma.


La identificación de un modelo de MA a menudo se realiza mejor con el ACF en lugar del PACF .

Para un modelo MA, el PACF teórico no se apaga, sino que se estrecha hacia 0 de alguna manera. Un patrón más claro para un modelo MA está en el ACF. El ACF tendrá autocorrelaciones distintas de cero solo en los retrasos involucrados en el modelo.

Un término de promedio móvil en un modelo de serie temporal es un error pasado (multiplicado por un coeficiente).

El modelo de media móvil de orden , indicado por MA (q) esqth

xt=μ+wt+θ1wt1+θ2wt2++θqwtq

conwtiidN(0,σw2).

Aquí, no es la semejanza del mensaje a través de los puntos de tiempo lo que se busca hacia atrás en el tiempo paso a paso, sino la contribución del ruido, que imagino como las desviaciones a menudo masivas que una caminata aleatoria puede conducir a lo largo de la línea de tiempo:

ingrese la descripción de la imagen aquí

Aquí hay múltiples secuencias progresivamente compensadas que están correlacionadas, descartando cualquier contribución de los pasos intermedios. Este sería el gráfico de las operaciones involucradas:ingrese la descripción de la imagen aquí

En este sentido, "CV es genial!" no es completamente diferente a "Naomi tiene una piscina". Desde el punto de vista del ruido, las rimas siguen ahí hasta el comienzo del juego.


Esta es una respuesta genial, buen trabajo (+1)
Firebug

Rob Hyndman sugiere esta estrategia para ARIMA, que utiliza tanto pacf como acf para determinar los pedidos. ¿Necesitamos saber de antemano qué series tenemos para usar la estrategia descrita en su respuesta? ¡Gracias!
stucash

Toma mi respuesta como un ejercicio didáctico. No soy un experto en el tema.
Antoni Parellada

4

Robert Nau, de la Duke's Fuqua School of Business, ofrece una explicación detallada y algo intuitiva de cómo se pueden utilizar los gráficos ACF y PACF para elegir los pedidos de AR y MA aquí y aquí . Doy un breve resumen de sus argumentos a continuación.

Una explicación simple de por qué PACF identifica el orden AR

Las autocorrelaciones parciales se pueden calcular ajustando una secuencia de modelos AR comenzando solo con el primer retraso y agregando progresivamente más retrasos. El coeficiente de retraso en un modelo AR ( ) da la autocorrelación parcial en el retraso . Dado esto, si la autocorrelación parcial "se corta" / deja de ser significativa en un cierto retraso (como se ve en un diagrama ACF), esto indica que ese retraso no agrega poder explicativo a un modelo y, por lo tanto, el orden AR debería ser el retraso anteriorkkk

Una explicación más completa que también aborda el uso de ACF para identificar el pedido de MA

Las series de tiempo pueden tener firmas AR o MA:

  • Una firma AR corresponde a un gráfico PACF que muestra un corte nítido y un ACF que decae más lentamente;
  • Una firma MA corresponde a un gráfico ACF que muestra un corte nítido y un gráfico PACF que decae más lentamente.

Las firmas de AR a menudo se asocian con autocorrelación positiva en el rezago 1, lo que sugiere que la serie está ligeramente "diferenciada" (esto significa que es necesaria una mayor diferenciación para eliminar por completo la autocorrelación). Dado que los términos AR logran una diferenciación parcial (ver más abajo), esto se puede solucionar agregando un término AR al modelo (de ahí el nombre de esta firma). Por lo tanto, un gráfico de PACF con un corte agudo (acompañado de un gráfico de ACF que decae lentamente con un primer retraso positivo) puede indicar el orden del término AR. Nau lo pone como sigue:

Si el PACF de la serie diferenciada muestra un corte nítido y / o la autocorrelación lag-1 es positiva, es decir, si la serie aparece ligeramente "poco diferenciada", considere agregar un término AR al modelo. El retraso en el que se corta el PACF es el número indicado de términos AR.

Las firmas de MA, por otro lado, se asocian comúnmente con primeros retrasos negativos, lo que sugiere que la serie está "sobrediferenciada" (es decir, es necesario cancelar parcialmente la diferencia para obtener una serie estacionaria). Dado que los términos de MA pueden cancelar un orden de diferenciación (ver más abajo), el diagrama ACF de una serie con una firma de MA indica el orden de MA necesario:

Si el ACF de la serie diferenciada muestra un corte nítido y / o la autocorrelación lag-1 es negativa, es decir, si la serie aparece ligeramente "sobrediferenciada", considere agregar un término MA al modelo. El retraso en el que se corta el ACF es el número indicado de términos MA.

Por qué los términos AR logran una diferencia parcial y los términos MA cancelan parcialmente las diferencias anteriores

Tome un modelo ARIMA básico (1,1,1), presentado sin la constante por simplicidad:

yt=YtYt1

yt=ϕyt1+etθet1

Definiendo como el operador de retraso / retroceso , esto se puede escribir de la siguiente manera:B

yt=(1B)Yt

yt=ϕByt+etθBet

que se puede simplificar aún más para dar:

(1ϕB)yt=(1θB)et

o equivalente:

(1ϕB)(1B)Yt=(1θB)et .

Podemos ver que el término AR (1) nos dio el término , por lo que parcialmente (si ) aumenta el orden de diferenciación. Además, si manipulamos como una variable numérica (lo que podemos hacer porque es un operador lineal), podemos ver que el término MA (1) nos dio el término , cancelando así parcialmente término original de diferenciación en el lado izquierdo.ϕ ( 0 , 1 ) B ( 1 - θ B ) ( 1 - B )(1ϕB)ϕ(0,1)B(1θB)(1B)


2

En un nivel superior, aquí es cómo entenderlo. (Si necesita un enfoque más matemático, con mucho gusto puedo seguir algunas de mis notas sobre análisis de series de tiempo)

ACF y PACF son construcciones estadísticas teóricas como un valor esperado o varianza, pero en diferentes dominios. De la misma manera que surgen los valores esperados al estudiar variables aleatorias, ACF y PACF surgen al estudiar series de tiempo.

Cuando se estudian variables aleatorias, está la cuestión de cómo estimar sus parámetros, que es donde entran el método de momentos, MLE y otros procedimientos y construcciones, así como también inspeccionar las estimaciones, sus errores estándar, etc.

Inspeccionar el ACF y el PACF estimados provienen de la misma idea, estimar los parámetros de un proceso aleatorio de series de tiempo. ¿Captar la idea?

Si cree que necesita una respuesta más inclinada a las matemáticas, hágamelo saber y trataré de ver si puedo elaborar algo al final del día.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.