Cómo contabilizar el impacto de las vacaciones en el pronóstico


12

Tengo una serie diaria bastante predecible con estacionalidad semanal. Puedo hacer predicciones que parecen ser bastante precisas (confirmadas por validación cruzada) cuando no hay vacaciones. Sin embargo, cuando hay vacaciones, tengo los siguientes problemas:

  1. En mi pronóstico obtengo números distintos de cero para las vacaciones, a pesar de que todas las vacaciones históricas son 0. Sin embargo, este no es el problema principal. El problema es ...
  2. Dado que el procesamiento que no ocurre en los días festivos "se extiende" a los días posteriores a los días festivos, una variable ficticia simple no lo reduce, ya que estos valores atípicos parecen ser innovadores a corto plazo. Si no hubiera estacionalidad semanal, tal vez podría llegar a una estimación para distribuir los datos no procesados ​​sobre el feriado durante los cinco o más días posteriores al feriado (como se sugiere en ¿Cómo se crean variables que reflejen el impacto de adelanto y rezago de los feriados? / efectos de calendario en un análisis de series de tiempo? ). Sin embargo, la distribución del "desbordamiento" depende del día de la semana en que ocurre el feriado y de si el feriado es Navidad o Día de Acción de Gracias, donde los pedidos se realizan a una tasa menor que el resto del año.

Aquí hay algunas instantáneas de mi validación cruzada que muestran el resultado predicho (azul) versus el resultado real (rojo) para las vacaciones que aparecen en diferentes días de la semana:

ingrese la descripción de la imagen aquí

También me preocupa que el impacto de la Navidad dependa del día de la semana en que caiga, y solo tengo seis años de datos históricos.

¿Alguien tiene alguna sugerencia sobre cómo lidiar con este tipo de valores atípicos innovadores en el contexto de los pronósticos? (Desafortunadamente no puedo compartir ningún dato)


1
Estoy bastante interesado en esto también.
EngrStudent - Restablece a Monica el

2
Si no puede publicar sus datos, ¿tal vez podría publicar datos inventados que sean similares a sus datos? En muchos casos, esto facilita respuestas más relevantes.
Tim

1
Escalar los datos. El modelo será el mismo (solo escalado). Incluso puede reescalar los pronósticos a su métrica original.
Tom Reilly el

Respuestas:


1

¿No podría crear una variable ficticia para vacaciones, una para vacaciones + 1 y otra para vacaciones + 2 y solo establecerlas en 1 siempre que caigan en un día laborable?

En cuanto a Acción de Gracias y Navidad, la introducción de variables ficticias separadas para estas vacaciones parece ser su peor opción (ya que solo tiene seis años de datos). Sin embargo, en cierta medida, esa podría ser su única opción: las personas simplemente se comportan de manera diferente en esas vacaciones que, por ejemplo, el 4 de julio (y si está estudiando, por ejemplo, los patrones de ventas minoristas, entonces definitivamente simplemente tiene que vivir con esos siendo vacaciones "especiales" y definitivamente querría analizarlas por separado). Sin embargo, quizás las siguientes ideas sean útiles para usted:

  • Acción de gracias. ¿No debería ser más fácil el hecho de que siempre cae el mismo día de la semana (jueves)? Es decir, un muñeco de Acción de Gracias podría ser viable incluso en un conjunto de datos de seis años porque el patrón de los días laborables siempre será el mismo.
  • Navidad. Al mirar su gráfico, me parece que el problema principal es que el efecto dura más que después de otras vacaciones: si define "Navidad" como Nochebuena (24 de diciembre), eso se debe a que muchas personas también se quedarán en casa el Día de Navidad (25 de diciembre) (e incluso el día del boxeo (26 de diciembre) en algunos lugares). Pensaré un poco más sobre esto.

Espero que esto ayude.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.