Tengo una serie diaria bastante predecible con estacionalidad semanal. Puedo hacer predicciones que parecen ser bastante precisas (confirmadas por validación cruzada) cuando no hay vacaciones. Sin embargo, cuando hay vacaciones, tengo los siguientes problemas:
- En mi pronóstico obtengo números distintos de cero para las vacaciones, a pesar de que todas las vacaciones históricas son 0. Sin embargo, este no es el problema principal. El problema es ...
- Dado que el procesamiento que no ocurre en los días festivos "se extiende" a los días posteriores a los días festivos, una variable ficticia simple no lo reduce, ya que estos valores atípicos parecen ser innovadores a corto plazo. Si no hubiera estacionalidad semanal, tal vez podría llegar a una estimación para distribuir los datos no procesados sobre el feriado durante los cinco o más días posteriores al feriado (como se sugiere en ¿Cómo se crean variables que reflejen el impacto de adelanto y rezago de los feriados? / efectos de calendario en un análisis de series de tiempo? ). Sin embargo, la distribución del "desbordamiento" depende del día de la semana en que ocurre el feriado y de si el feriado es Navidad o Día de Acción de Gracias, donde los pedidos se realizan a una tasa menor que el resto del año.
Aquí hay algunas instantáneas de mi validación cruzada que muestran el resultado predicho (azul) versus el resultado real (rojo) para las vacaciones que aparecen en diferentes días de la semana:
También me preocupa que el impacto de la Navidad dependa del día de la semana en que caiga, y solo tengo seis años de datos históricos.
¿Alguien tiene alguna sugerencia sobre cómo lidiar con este tipo de valores atípicos innovadores en el contexto de los pronósticos? (Desafortunadamente no puedo compartir ningún dato)