Interpretación del modelo ARIMA

Tengo una pregunta sobre los modelos ARIMA. Digamos que tengo una serie temporal que me gustaría pronosticar y un modelo parece una buena forma de realizar el ejercicio de pronóstico. Ahora las rezagadas implican que mi serie de hoy está influenciada por eventos anteriores. Esto tiene sentido. Pero, ¿cuál es la interpretación de los errores? ¿Mi residual anterior (qué tan mal estaba en mi cálculo) está influyendo en el valor de mi serie hoy? ¿Cómo se calculan los residuos rezagados en esta regresión, ya que es el producto / resto de la regresión? $Y_t$ $\text{ARIMA}(2,2)$

Δ Y_{t} = α_{1} Δ Y_{t - 1} + α_{2} Δ Y_{t - 2} + ν_{t} + θ_{1} ν_{t - 1} + θ_{2} ν_{t - 2}

$\Delta Y_t = \alpha_1 \Delta Y_{t-1} + \alpha_2 \Delta Y_{t-2} + \nu_{t} + \theta_1 \nu_{t-1} + \theta_2 \nu_{t-2}$

Y

$Y$

regression time-series interpretation

— gabriel
fuente

Creo que debe recordar que los modelos ARIMA son modelos ateóricos , por lo que las reglas habituales de interpretación de los coeficientes de regresión estimados no se aplican estrictamente de la misma manera. Los modelos ARIMA tienen ciertas características a tener en cuenta. Por ejemplo, cuanto más bajos son los valores de en un AR (1), más rápida es la tasa de convergencia. Pero, por ejemplo, un modelo AR (2). ¡No todos los modelos AR (2) son iguales! Por ejemplo, si la condición se cumple, entonces el AR (2) muestra un comportamiento pseudo periódico y, como resultado, sus pronósticos son ciclos estocásticos.

α_{1}

$\alpha_{1}$

(α_{1}^{2} + 4 α_{2} < 0)

$(\alpha_{1}^{2}+4\alpha_{2}<0)$

— Graeme Walsh

(cont ...) De manera algo similar, cuando se trata de autorregresiones de vectores, uno tiende a interpretar las funciones de respuesta al impulso (IRF) en lugar de los coeficientes estimados; los coeficientes son a menudo demasiado difíciles de interpretar, pero generalmente se puede tener sentido de los IRF. Por curiosidad, ¿ha encontrado muchos artículos en los que los autores dedicaron mucha atención a interpretar los coeficientes en un modelo ARIMA?

— Graeme Walsh

Parece haber un problema de notación. " " no puede ser correcto, ya que los modelos ARIMA tienen tres términos para cada uno de los componentes AR / I / MA respectivamente, mientras que los modelos ARMA tienen dos (p. ej. ), pero parece que tiene una primera diferencia, lo que sugiere que quiere decir . Edite para reflejar su intención.

ARIMA (2, 2)

$\text{ARIMA}(2,2)$

(p, d, q)

$(p,d,q)$

ARMA (2, 2)

$\text{ARMA}(2,2)$

ARIMA (2, 1, 2)

$\text{ARIMA}(2,1,2)$

— Glen_b -Reinstala Monica el

@Glen_b Recuerdo haber hecho lo mismo en otra pregunta . Resulta que tenemos una especie de duplicación. La presente pregunta y la vinculada a son muy similares.

— Graeme Walsh

Creo que debe recordar que los modelos ARIMA son modelos ateóricos , por lo que el enfoque habitual para interpretar los coeficientes de regresión estimados no se aplica realmente al modelado ARIMA.

Para interpretar (o comprender) los modelos ARIMA estimados, sería bueno conocer las diferentes características que muestran una serie de modelos ARIMA comunes.

Podemos explorar algunas de estas características investigando los tipos de pronósticos producidos por diferentes modelos ARIMA. Este es el enfoque principal que he tomado a continuación, pero una buena alternativa sería mirar las funciones de respuesta al impulso o las rutas de tiempo dinámicas asociadas con diferentes modelos ARIMA (o ecuaciones de diferencia estocástica). Hablaré de esto al final.

Modelos AR (1)

Consideremos un modelo AR (1) por un momento. En este modelo, podemos decir que cuanto más bajo es el valor de , más rápido es la tasa de convergencia (a la media). Podemos intentar comprender este aspecto de los modelos AR (1) investigando la naturaleza de los pronósticos para un pequeño conjunto de modelos AR (1) simulados con diferentes valores para . $\alpha_{1}$ $\alpha_{1}$

El conjunto de cuatro modelos AR (1) que discutiremos se puede escribir en notación algebraica como: donde es una constante y el resto de la notación se sigue del OP. Como se puede ver, cada modelo difiere solo con respecto al valor de .

Y_{t} = C + 0.95 Y_{t - 1} + ν_{t} (1) Y_{t} = C + 0.8 Y_{t - 1} + ν_{t} (2) Y_{t} = C + 0,5 Y_{t - 1} + ν_{t} (3) Y_{t} = C + 0.4 0.4 Y_{t - 1} + ν_{t} (4 4)

$\begin{equation} Y_{t} = C + 0.95 Y_{t-1} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (1)\\ Y_{t} = C + 0.8 Y_{t-1} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (2)\\ Y_{t} = C + 0.5 Y_{t-1} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (3)\\ Y_{t} = C + 0.4 Y_{t-1} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (4) \end{equation}$

C

$C$

α_{1}

$\alpha_{1}$

En el gráfico a continuación, he trazado pronósticos fuera de la muestra para estos cuatro modelos AR (1). Se puede ver que los pronósticos para el modelo AR (1) con convergen a una tasa más lenta con respecto a los otros modelos. Los pronósticos para el modelo AR (1) con convergen a un ritmo más rápido que los demás. $\alpha_{1} = 0.95$ $\alpha_{1} = 0.4$

ingrese la descripción de la imagen aquí

Nota: cuando la línea roja es horizontal, ha alcanzado la media de la serie simulada.

Modelos MA (1)

Ahora consideremos cuatro modelos MA (1) con diferentes valores para . Los cuatro modelos que discutiremos se pueden escribir como: $\theta_{1}$

Y_{t} = C + 0,95 ν_{t - 1} + ν_{t} (5 5) Y_{t} = C + 0.8 ν_{t - 1} + ν_{t} (6 6) Y_{t} = C + 0,5 ν_{t - 1} + ν_{t} (7 7) Y_{t} = C + 0.4 0.4 ν_{t - 1} + ν_{t} (8)

$\begin{equation} Y_{t} = C + 0.95 \nu_{t-1} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (5)\\ Y_{t} = C + 0.8 \nu_{t-1} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (6)\\ Y_{t} = C + 0.5 \nu_{t-1} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (7)\\ Y_{t} = C + 0.4 \nu_{t-1} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (8) \end{equation}$

En el gráfico a continuación, he trazado pronósticos fuera de la muestra para estos cuatro modelos MA (1) diferentes. Como muestra el gráfico, el comportamiento de los pronósticos en los cuatro casos es marcadamente similar; convergencia rápida (lineal) a la media. Observe que hay menos variedad en la dinámica de estos pronósticos en comparación con los de los modelos AR (1).

ingrese la descripción de la imagen aquí

Nota: cuando la línea roja es horizontal, ha alcanzado la media de la serie simulada.

Modelos AR (2)

Las cosas se ponen mucho más interesantes cuando comenzamos a considerar modelos ARIMA más complejos. Tomemos, por ejemplo, los modelos AR (2). Estos son solo un pequeño paso adelante del modelo AR (1), ¿verdad? Bueno, a uno le gustaría pensar eso, pero la dinámica de los modelos AR (2) es bastante rica en variedad, como veremos en un momento.

Exploremos cuatro modelos diferentes de AR (2):

Y_{t} = C + 1.7 Y_{t - 1} - 0.8 Y_{t - 2} + ν_{t} (9 9) Y_{t} = C + 0.9 Y_{t - 1} - 0.2 0.2 Y_{t - 2} + ν_{t} (10) Y_{t} = C + 0,5 Y_{t - 1} - 0.2 0.2 Y_{t - 2} + ν_{t} (11) Y_{t} = C + 0.1 Y_{t - 1} - 0.7 Y_{t - 2} + ν_{t} (12)

$\begin{equation} Y_{t} = C + 1.7 Y_{t-1} -0.8 Y_{t-2} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (9)\\ Y_{t} = C + 0.9 Y_{t-1} -0.2 Y_{t-2} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (10)\\ Y_{t} = C + 0.5 Y_{t-1} -0.2 Y_{t-2} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (11)\\ Y_{t} = C + 0.1 Y_{t-1} -0.7 Y_{t-2} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (12) \end{equation}$

Los pronósticos fuera de muestra asociados con cada uno de estos modelos se muestran en el gráfico a continuación. Está bastante claro que cada uno difiere significativamente y también son muy variados en comparación con los pronósticos que hemos visto anteriormente, excepto por los pronósticos del modelo 2 (gráfico superior derecho) que se comportan de manera similar a los de un AR (1) modelo.

ingrese la descripción de la imagen aquí

Nota: cuando la línea roja es horizontal, ha alcanzado la media de la serie simulada.

α_{1}^{2} + 4 4 α_{2} < 0 0,

$\begin{equation} \alpha_{1}^{2}+4\alpha_{2} < 0, \end{equation}$

Vale la pena señalar que la condición anterior proviene de la solución general a la forma homogénea de la ecuación de diferencia lineal, autónoma y de segundo orden (con raíces complejas). Si esto le resulta extraño, le recomiendo el Capítulo 1 de Hamilton (1994) y el Capítulo 20 de Hoy et al. (2001)

(1.7)^{2} + 4 4 (- 0.8) = - 0,31 < 0 0 (13) (0.9)^{2} + 4 4 (- 0.2 0.2) = 0,01 > 0 0 (14) (0,5)^{2} + 4 4 (- 0.2 0.2) = - 0,55 < 0 0 (15) (0.1)^{2} + 4 4 (- 0.7) = - 2,54 < 0 0 (dieciséis)

$\begin{equation} (1.7)^{2} + 4 (-0.8) = -0.31 < 0 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (13)\\ (0.9)^{2} + 4 (-0.2) = 0.01 > 0 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (14)\\ (0.5)^{2} + 4 (-0.2) = -0.55 < 0 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (15)\\ (0.1)^{2} + 4 (-0.7) = -2.54 < 0 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (16) \end{equation}$

Como se esperaba por la aparición de los pronósticos trazados, la condición se cumple para cada uno de los cuatro modelos, excepto para el modelo 2. Recordemos del gráfico, los pronósticos del modelo 2 se comportan ("normalmente") de manera similar a los pronósticos de un modelo AR (1). Los pronósticos asociados con los otros modelos contienen ciclos.

Aplicación - Modelado de inflación

$\pi_{t}$

π_{t} = C + α_{1} π_{t - 1} + α_{2} π_{t - 2} + ν_{t} .

$\begin{equation} \pi_{t} = C + \alpha_{1} \pi_{t-1} + \alpha_{2} \pi_{t-2} + \nu_{t}. \end{equation}$ . Ahora, no argumentaría en contra de tal interpretación, pero sugeriría que se tome precaución y que debamos profundizar un poco más para idear una interpretación adecuada. En este caso, podríamos preguntar, ¿de qué manera la inflación está relacionada con los niveles anteriores de inflación? ¿Hay ciclos? Si es así, ¿cuántos ciclos hay? ¿Podemos decir algo sobre el pico y el valle? ¿Qué tan rápido convergen los pronósticos con la media? Y así.

Este es el tipo de preguntas que podemos hacer al intentar interpretar un modelo AR (2) y, como puede ver, no es tan sencillo como tomar un coeficiente estimado y decir "un aumento de 1 unidad en esta variable está asociado con un aumento de muchas unidades en la variable dependiente " , asegurándose de adjuntar la condición ceteris paribus a esa declaración, por supuesto.

Tenga en cuenta que en nuestra discusión hasta ahora, solo hemos explorado una selección de modelos AR (1), MA (1) y AR (2). Ni siquiera hemos visto la dinámica de los modelos ARMA mixtos y los modelos ARIMA que implican retrasos más altos.

$\alpha_{2}$

π_{t} = C + α_{1} π_{t - 1} + α_{3} π_{t - 3} + θ_{1} ν_{t - 1} + ν_{t} .

$\begin{equation} \pi_{t} = C + \alpha_{1} \pi_{t-1} + \alpha_{3} \pi_{t-3} + \theta_{1}\nu_{t-1} + \nu_{t}. \end{equation}$

Di lo que quieras, pero aquí es mejor tratar de entender la dinámica del sistema en sí. Como antes, podemos ver y ver qué tipo de pronósticos produce el modelo, pero el enfoque alternativo que mencioné al comienzo de esta respuesta fue observar la función de respuesta al impulso o la ruta de tiempo asociada con el sistema.

Esto me lleva a la siguiente parte de mi respuesta donde discutiremos las funciones de respuesta al impulso.

Funciones de respuesta al impulso

Aquellos que estén familiarizados con las autorregresiones de vectores (VAR) se darán cuenta de que generalmente se trata de comprender el modelo VAR estimado al interpretar las funciones de respuesta al impulso; en lugar de tratar de interpretar los coeficientes estimados que a menudo son demasiado difíciles de interpretar de todos modos.

Se puede adoptar el mismo enfoque cuando se intenta comprender los modelos ARIMA. Es decir, en lugar de tratar de dar sentido a declaraciones (complicadas) como "la inflación de hoy depende de la inflación de ayer y de la inflación de hace dos meses, ¡pero no de la inflación de la semana pasada!" , en su lugar, graficamos la función de respuesta al impulso y tratamos de darle sentido.

Aplicación - Cuatro variables macro

\begin{array}{rcl} Y_{t} & = & 3.20 + 0,22 Y_{t - 1} + 0,15 Y_{t - 2} + ν_{t} \\ π_{t} & = & 4.10 + 0,46 π_{t - 1} + 0,31 π_{t - 2} + 0,16 π_{t - 3} + 0,01 π_{t - 4 4} + ν_{t} \\ {tu}_{t} & = & 6.2 + 1,58 {tu}_{t - 1} - 0,64 {tu}_{t - 2} + ν_{t} \\ r_{t} & = & 6.0 + 1,18 r_{t - 1} - 0.23 r_{t - 2} + ν_{t} \end{array}

$\begin{eqnarray} Y_{t} &=& 3.20 + 0.22 Y_{t-1} + 0.15 Y_{t-2} + \nu_{t}\\ \pi_{t} &=& 4.10 + 0.46 \pi_{t-1} + 0.31\pi_{t-2} + 0.16\pi_{t-3} + 0.01\pi_{t-4} + \nu_{t}\\ u_{t} &=& 6.2+ 1.58 u_{t-1} - 0.64 u_{t-2} + \nu_{t}\\ r_{t} &=& 6.0 + 1.18 r_{t-1} - 0.23 r_{t-2} + \nu_{t} \end{eqnarray}$

Y_{t}

$Y_{t}$

t

$t$

π

$\pi$

u

$u$

r

$r$

Las ecuaciones muestran que el crecimiento del PIB, la tasa de desempleo y la tasa de interés a corto plazo se modelan como procesos AR (2) mientras que la inflación se modela como un proceso AR (4).

En lugar de tratar de interpretar los coeficientes en cada ecuación, grafiquemos las funciones de respuesta al impulso (IRF) y las interpretemos en su lugar. El siguiente gráfico muestra las funciones de respuesta al impulso asociadas con cada uno de estos modelos.

ingrese la descripción de la imagen aquí

No tome esto como una clase magistral en la interpretación de los IRF, piense más como una introducción básica, pero de todos modos, para ayudarnos a interpretar los IRF, necesitaremos acostumbrarnos a dos conceptos; impulso y persistencia .

Estos dos conceptos se definen en Leamer (2010) de la siguiente manera:

Momentum : Momentum es la tendencia a seguir moviéndose en la misma dirección. El efecto de impulso puede compensar la fuerza de regresión (convergencia) hacia la media y puede permitir que una variable se aleje de su media histórica, durante algún tiempo, pero no indefinidamente.

Persistencia : una variable de persistencia se quedará donde está y convergerá lentamente solo a la media histórica.

Equipados con este conocimiento, ahora hacemos la pregunta: supongamos que una variable está en su media histórica y recibe un choque temporal de una unidad en un solo período, ¿cómo responderá la variable en períodos futuros? Esto es similar a hacer esas preguntas que hicimos antes, como ¿los pronósticos contienen ciclos? , ¿qué tan rápido convergen los pronósticos con la media? etc.

Por fin, ahora podemos intentar interpretar los IRF.

Después de un choque de una unidad, la tasa de desempleo y la tasa de interés a corto plazo (tesorería a 3 meses) se llevan más allá de su media histórica. Este es el efecto de impulso. Los IRF también muestran que la tasa de desempleo se sobrepasa en mayor medida que la tasa de interés a corto plazo.

También vemos que todas las variables vuelven a sus medios históricos (ninguna de ellas "explota"), aunque cada una hace esto a ritmos diferentes. Por ejemplo, el crecimiento del PIB vuelve a su media histórica después de aproximadamente 6 períodos después de un choque, la tasa de desempleo vuelve a su media histórica después de aproximadamente 18 períodos, pero la inflación y los intereses a corto plazo tardan más de 20 períodos en volver a sus medios históricos. En este sentido, el crecimiento del PIB es la menos persistente de las cuatro variables, mientras que se puede decir que la inflación es altamente persistente.

Creo que es una conclusión justa decir que hemos logrado (al menos parcialmente) dar sentido a lo que los cuatro modelos ARIMA nos dicen sobre cada una de las cuatro variables macro.

Conclusión

En lugar de tratar de interpretar los coeficientes estimados en los modelos ARIMA (difícil para muchos modelos), intente comprender la dinámica del sistema. Podemos intentar esto explorando los pronósticos producidos por nuestro modelo y trazando la función de respuesta al impulso.

[Estoy feliz de compartir mi código R si alguien lo quiere.]

Referencias

Hamilton, JD (1994). Análisis de series de tiempo (Vol. 2). Princeton: Princeton university press.
Leamer, E. (2010). Patrones e historias macroeconómicas: una guía para MBA, Springer.
Stengos, T., M. Hoy, J. Livernois, C. McKenna y R. Rees (2001). Matemáticas para la economía, segunda edición, MIT Press: Cambridge, MA.

— Graeme Walsh
fuente

Me encanta la aplicación de IRF a personas que no son VAR. Siempre parecen estar asociados y nunca pensé en usar IRF en simples ARIMA. (Además, ¿quién puede entender realmente qué hacen los términos de MA?)

— Wayne

¡Qué gran respuesta!

— Richard Hardy

$MA(\infty)$

Δ Y_{t} = \sum_{j = 0 0}^{\infty} ψ_{j} ν_{t - j}

$\Delta Y_t=\sum_{j=0}^{\infty} \psi_j\nu_{t-j}$

$MA(1)$ $AR(1)$

Y_{t} = ν_{t} + θ_{1} ν_{t - 1}

$Y_t=\nu_t+\theta_{1}\nu_{t-1}$

Y_{t} = ρ Y_{t - 1} + ν_{t} = ν_{t} + ρ ν_{t - 1} + ρ^{2} ν_{t - 1} + . . .

$Y_t=\rho Y_{t-1}+\nu_{t}=\nu_t+\rho \nu_{t-1}+ \rho^2 \nu_{t-1}+...$

puede decir que los términos de error en los modelos ARMA explican la influencia "a corto plazo" del pasado, y los términos rezagados explican la influencia "a largo plazo". Dicho esto, no creo que esto ayude mucho y, por lo general, nadie se molesta con la interpretación precisa de los coeficientes ARMA. El objetivo generalmente es obtener un modelo adecuado y usarlo para pronosticar.

— mpiktas
fuente

+1 Esto es más o menos a lo que estaba intentando llegar en mis comentarios anteriores.

— Graeme Walsh

Ja, no vi sus comentarios, cuando estaba escribiendo la respuesta. Sugiero convertirlos a la respuesta.

— mpiktas 01 de

$n$ $c_1,c_2,...,c_n$

Y (t) = C_{1} Y (t - 1) + C_{2} Y (t - 2) + C_{3} Y (t - 3) + . . . + C_{norte} Y (t - norte) + un (t)

$Y(t) =c_1 Y(t−1) + c_2 Y(t-2) + c_3 Y(t-3)+ ... + c_n Y(t-n) + a(t)$

De esta forma, un modelo ARIMA puede explicarse como la respuesta a la pregunta.

¿Cuántos valores históricos debo usar para calcular una suma ponderada del pasado?
Precisamente, ¿cuáles son esos valores?

— IrishStat
fuente