Soy un graduado de negocios y economía que actualmente estudia para una maestría en ingeniería de datos. Mientras estudiaba la regresión lineal (LR) y luego el análisis de series de tiempo (TS), surgió una pregunta en mi mente. ¿Por qué crear un método completamente nuevo, es decir, series de tiempo (ARIMA), en lugar de usar regresión lineal múltiple y agregarle variables rezagadas (con el orden de los rezagos determinado usando ACF y PACF)? Entonces la maestra me sugirió que escribiera un pequeño ensayo sobre el tema. No venía a buscar ayuda con las manos vacías, así que hice mi investigación sobre el tema.
Ya sabía que cuando se usa LR, si se violan los supuestos de Gauss-Markov, la regresión de OLS es incorrecta, y que esto sucede cuando se usan datos de series de tiempo (autocorrelación, etc.). (Otra pregunta sobre esto, una suposición de GM es que las variables independientes deberían distribuirse normalmente, ¿o solo la variable dependiente condicional a las independientes?)
También sé que cuando uso una regresión de retraso distribuida, que es lo que creo que estoy proponiendo aquí, y uso de OLS para estimar parámetros, puede surgir (obviamente) la multicolinealidad entre variables, por lo que las estimaciones serían incorrectas.
En una publicación similar sobre TS y LR aquí, @IrishStat dijo:
... un modelo de regresión es un caso particular de un Modelo de Función de Transferencia también conocido como modelo de regresión dinámica o modelo XARMAX. El punto destacado es la identificación del modelo en series de tiempo, es decir, las diferencias apropiadas, los retrasos apropiados de las X, la estructura ARIMA apropiada, la identificación apropiada de la estructura determinista no especificada, como Pulsos, Cambios de nivel, Tendencias de tiempo local, Pulsos estacionales e incorporación de los cambios en los parámetros o la varianza del error debe considerarse.
(También leí su artículo en Autobox sobre Box Jenkins vs LR.) Pero esto todavía no resuelve mi pregunta (o al menos no aclara las diferentes mecánicas de RL y TS para mí).
Es obvio que incluso con variables rezagadas surgen problemas OLS y no es eficiente ni correcto, pero cuando se usa la máxima probabilidad, ¿persisten estos problemas? He leído que ARIMA se estima a través de la máxima probabilidad, por lo que si el LR con rezagos se estima con ML en lugar de OLS, ¿produce los coeficientes "correctos" (supongamos que también incluimos términos de error rezagados, como un MA de orden q).
En resumen, ¿es el problema OLS? ¿Se solucionó el problema aplicando ML?