El problema con el que estoy lidiando es predecir valores de series de tiempo. Estoy mirando una serie de tiempo a la vez y, por ejemplo, en base al 15% de los datos de entrada, me gustaría predecir sus valores futuros. Hasta ahora me he encontrado con dos modelos:
He probado ambos y leí algunos artículos sobre ellos. Ahora estoy tratando de tener una mejor idea de cómo comparar los dos. Lo que he encontrado hasta ahora:
- LSTM funciona mejor si se trata de una gran cantidad de datos y hay suficientes datos de capacitación disponibles, mientras que ARIMA es mejor para conjuntos de datos más pequeños (¿es esto correcto?)
- ARIMA requiere una serie de parámetros
(p,q,d)
que deben calcularse en función de los datos, mientras que LSTM no requiere establecer dichos parámetros. Sin embargo, hay algunos hiperparámetros que necesitamos ajustar para LSTM.
Aparte de las propiedades mencionadas anteriormente, no pude encontrar ningún otro punto o hecho que pudiera ayudarme a seleccionar el mejor modelo. Estaría realmente agradecido si alguien pudiera ayudarme a encontrar artículos, documentos u otras cosas (hasta ahora no tuve suerte, solo algunas opiniones generales aquí y allá y nada basado en experimentos).
Debo mencionar que originalmente estoy tratando con datos de transmisión, sin embargo, por ahora estoy usando conjuntos de datos NAB que incluyen 50 conjuntos de datos con el tamaño máximo de 20k puntos de datos.