Tengo una variable continua, muestreada durante un período de un año a intervalos irregulares. Algunos días tienen más de una observación por hora, mientras que otros períodos no tienen nada durante días. Esto hace que sea particularmente difícil detectar patrones en las series de tiempo, porque algunos meses (por ejemplo, octubre) están altamente muestreados, mientras que otros no.
Mi pregunta es ¿cuál sería el mejor enfoque para modelar esta serie de tiempo?
- Creo que la mayoría de las técnicas de análisis de series temporales (como ARMA) necesitan una frecuencia fija. Podría agregar los datos para tener una muestra constante o elegir un subconjunto de datos que sea muy detallado. Con ambas opciones me faltaría información del conjunto de datos original, que podría revelar patrones distintos.
- En lugar de descomponer la serie en ciclos, podría alimentar el modelo con todo el conjunto de datos y esperar que recoja los patrones. Por ejemplo, transformé la hora, el día de la semana y el mes en variables categóricas y probé una regresión múltiple con buenos resultados (R2 = 0.71)
Tengo la idea de que las técnicas de aprendizaje automático como ANN también pueden elegir estos patrones de series temporales desiguales, pero me preguntaba si alguien lo ha intentado y podría darme algún consejo sobre la mejor manera de representar patrones de tiempo en una red neuronal.