Realmente creo que esta es una buena pregunta y merece una respuesta. El enlace provisto está escrito por un psicólogo que afirma que algún método de elaboración casera es una mejor manera de hacer análisis de series de tiempo que Box-Jenkins. Espero que mi intento de respuesta aliente a otros, que tienen más conocimientos sobre series de tiempo, a contribuir.
Desde su introducción, parece que Darlington está defendiendo el enfoque de simplemente ajustar un modelo AR por mínimos cuadrados. Es decir, si desea ajustar el modelo
a la serie temporal , simplemente puede hacer una regresión de la serie en la serie con retraso , retraso , y así sucesivamente hasta el retraso , usando una regresión múltiple ordinaria. Esto ciertamente está permitido; en R, es incluso una opción en la función. Lo probé y tiende a dar respuestas similares al método predeterminado para ajustar un modelo AR en R.
zt= α1zt - 1+ ⋯ + αkzt - k+ εt
ztzt12kar
También aboga por hacer retroceder en cosas como o poderes de para encontrar tendencias. De nuevo, esto está absolutamente bien. Muchos libros de series de tiempo discuten esto, por ejemplo Shumway-Stoffer y Cowpertwait-Metcalfe. Por lo general, un análisis de series de tiempo podría proceder en las siguientes líneas: encuentra una tendencia, la elimina y luego ajusta un modelo a los residuos.zttt
Pero parece que también está abogando por un ajuste excesivo y luego usa la reducción del error cuadrático medio entre la serie ajustada y los datos como evidencia de que su método es mejor. Por ejemplo:
Siento que los correlogramas ahora son obsoletos. Su propósito principal era permitir a los trabajadores adivinar qué modelos se ajustan mejor a los datos, pero la velocidad de las computadoras modernas (al menos en regresión, si no en el ajuste de modelos de series de tiempo) permite a un trabajador simplemente ajustar varios modelos y ver exactamente cómo cada uno se ajusta según lo medido por el error cuadrático medio. [El tema de la capitalización del azar no es relevante para esta elección, ya que los dos métodos son igualmente susceptibles a este problema.]
Esta no es una buena idea porque se supone que la prueba de un modelo es qué tan bien puede pronosticar, no qué tan bien se ajusta a los datos existentes. En sus tres ejemplos, utiliza el "error cuadrático medio ajustado de raíz" como criterio para la calidad del ajuste. Por supuesto, el ajuste excesivo de un modelo hará que una estimación de error en la muestra sea más pequeña, por lo que su afirmación de que sus modelos son "mejores" porque tienen un RMSE más pequeño está mal.
En pocas palabras, dado que está utilizando el criterio incorrecto para evaluar qué tan bueno es un modelo, llega a conclusiones erróneas sobre la regresión frente a ARIMA. Apostaría a que, si hubiera probado la capacidad predictiva de los modelos, ARIMA habría salido adelante. Quizás alguien pueda intentarlo si tiene acceso a los libros que menciona aquí .
[Complementario: para obtener más información sobre la idea de regresión, es posible que desee consultar los libros de series de tiempo más antiguos que se escribieron antes de que ARIMA se convirtiera en el más popular. Por ejemplo, Kendall, Time-Series , 1973, Capítulo 11 tiene un capítulo completo sobre este método y comparaciones con ARIMA.]