No parece haber una forma estándar de tratar los datos faltantes en el contexto de la familia de modelos de suavizado exponencial. En particular, la implementación de R llamada ets en el paquete de pronóstico parece tomar la subsecuencia más larga sin datos faltantes, y el libro "Pronóstico con suavizado exponencial" de Hyndman et al. no parece hablar de datos faltantes en absoluto.
Me gustaría hacer un poco más, si mis usuarios me lo piden explícitamente (y si los datos que faltan no aparecen demasiado juntos o en demasiados períodos que son exactamente una temporada aparte). En particular, lo que tengo en mente es lo siguiente. Durante la simulación, cada vez que encuentro un valor perdido , sustituyo el pronóstico del punto actual ˜ y t por y t , de modo que ε t = 0 . Esto, por ejemplo, haría que el punto de datos no sea considerado para el proceso de optimización de parámetros.
Una vez que tengo un ajuste razonable para los parámetros, puedo estimar la desviación estándar de los errores (se supone que es normal con la media ) y verificar que el uso de valores para ϵ t generados a partir de esa distribución no disminuya la probabilidad en un factor importante. También usaría tales valores para pronosticar (usando simulación).
¿Existen dificultades conocidas con este método?