Michael Chernick te señala en la dirección correcta. También miraría el trabajo de Ruey Tsay, ya que se agrega a este conjunto de conocimientos. Ver más aquí .
No puede competir contra los algoritmos informáticos automatizados de hoy. Analizan muchas formas de abordar las series de tiempo que no ha considerado y que a menudo no está documentado en ningún documento o libro. Cuando uno pregunta cómo hacer un ANOVA, se puede esperar una respuesta precisa cuando se compara con diferentes algoritmos. Cuando uno hace la pregunta de cómo hago el reconocimiento de patrones, muchas respuestas son posibles ya que están involucradas las heurísticas. Su pregunta implica el uso de heurística.
La mejor manera de ajustar un modelo ARIMA, si existen valores atípicos en los datos, es evaluar los posibles estados de la naturaleza y seleccionar el enfoque que se considera óptimo para un conjunto de datos en particular. Un posible estado de la naturaleza es que el proceso ARIMA es la fuente principal de variación explicada. En este caso, uno "identificaría tentativamente" el proceso ARIMA a través de la función acf / pacf y luego examinaría los residuos para detectar posibles valores atípicos. Los valores atípicos pueden ser Pulsos, es decir, eventos únicos O pulsos estacionales que se evidencian por valores atípicos sistemáticos a alguna frecuencia (digamos, 12 para datos mensuales). Un tercer tipo de valores atípicos es donde uno tiene un conjunto contiguo de pulsos, cada uno con el mismo signo y magnitud, esto se llama un cambio de paso o nivel. Después de examinar los residuos del proceso ARIMA tentativo, se puede agregar tentativamente la estructura determinista identificada empíricamente para crear un modelo combinado tentativo. Tampoco si la fuente principal de variación es uno de los 4 tipos o "valores atípicos", entonces sería mejor identificarlos ab initio (primero) y luego usar los residuos de este "modelo de regresión" para identificar la estructura estocástica (ARIMA) . Ahora, estas dos estrategias alternativas se vuelven un poco más complicadas cuando uno tiene un "problema" en el que los parámetros ARIMA cambian con el tiempo o la varianza del error cambia con el tiempo debido a una serie de posibles causas, posiblemente la necesidad de mínimos cuadrados ponderados o una transformación de potencia como registros / recíprocos, etc. Otra complicación / oportunidad es cómo y cuándo formar la contribución de las series de predictores sugeridas por el usuario para formar un modelo perfectamente integrado que incorpore memoria, causales y series ficticias identificadas empíricamente. Este problema se agrava aún más cuando uno tiene series de tendencias mejor modeladas con series de indicadores de la forma0,0,0,0,1,2,3,4,... , o combinaciones de series de cambio de nivel como . Es posible que desee probar y escribir dichos procedimientos en R, pero la vida es corta. Me gustaría resolver su problema y demostrar en este caso cómo funciona el procedimiento, publique los datos o envíelos a sales@autobox.com1,2,3,4,5,...n0,0,0,0,0,0,1,1,1,1,1
Comentario adicional después de recibir / analizar los datos / datos diarios para un tipo de cambio extranjero / 18 = 765 valores a partir del 1/1/2007
Los datos tenían un acf de:
Al identificar un modelo de arma de la forma y una serie de valores atípicos, el acf de los residuos indica aleatoriedad ya que los valores de acf son muy pequeños. AUTOBOX identificó una serie de valores atípicos:(1,1,0)(0,0,0)
El modelo final:
incluyó la necesidad de un aumento de estabilización de varianza a la TSAY donde se identificaron e incorporaron cambios de varianza en los residuos. El problema que tuvo con su ejecución automática fue que el procedimiento que estaba utilizando, como un contador, cree los datos en lugar de cuestionarlos a través de la detección de intervención (también conocida como detección de valores atípicos). He publicado un análisis completo aquí .