Cuando tiene datos de panel, hay diferentes tareas que puede intentar resolver, por ejemplo, clasificación / regresión de series de tiempo o pronóstico de panel. Y para cada tarea, existen numerosos enfoques para resolverlo.
Cuando desee utilizar métodos de aprendizaje automático para resolver pronósticos de paneles, existen varios enfoques:
Con respecto a sus datos de entrada (X), tratando unidades (por ejemplo, países, individuos, etc.) como muestras de iid, puede
- bin la serie de tiempo y trate cada bin como una columna separada, ignorando cualquier orden temporal, con bins iguales para todas las unidades, el tamaño del bin podría, por supuesto, ser simplemente la medición de la serie de tiempo observada, o podría muestrear y agregar en bins más grandes, luego utilizar algoritmos de aprendizaje automático estándar para datos tabulares,
- o extraiga características de la serie de tiempo para cada unidad, y use cada característica extraída como columnas separadas, nuevamente combinadas con algoritmos tabulares estándar,
- o use algoritmos especializados de regresión / clasificación de series temporales dependiendo de si observa datos de series temporales continuas o categóricas, esto incluye máquinas de vectores de soporte con núcleos especiales que comparan series temporales con series temporales.
Con respecto a sus datos de salida (y), si desea pronosticar múltiples puntos de tiempo en el futuro, puede
- ajuste un estimador para cada paso adelante que desee pronosticar, utilizando siempre los mismos datos de entrada,
- o ajuste un solo estimador para el primer paso adelante y en la predicción, pase los datos de entrada a tiempo, usando las predicciones del primer paso para agregar a los datos de entrada observados para hacer las predicciones del segundo paso y así sucesivamente.
Todos los enfoques anteriores básicamente reducen el problema de pronóstico del panel a una regresión de series de tiempo o un problema de regresión tabular. Una vez que sus datos están en la serie de tiempo o en el formato de regresión tabular, también puede agregar cualquier característica invariable en el tiempo para los usuarios.
Por supuesto, hay otras opciones para resolver el problema del pronóstico del panel, como por ejemplo, usar métodos de pronóstico clásicos como ARIMA adaptado a los datos del panel o métodos de aprendizaje profundo que le permiten realizar predicciones de secuencia a secuencia directamente.