El problema con el que estoy lidiando es predecir valores de series de tiempo. Estoy viendo una serie de tiempo a la vez y, por ejemplo, en base al 15% de los datos de entrada, me gustaría predecir sus valores futuros. Hasta ahora me he encontrado con dos modelos:
- LSTM (memoria a corto plazo; una clase de redes neuronales recurrentes)
- ARIMA
He probado ambos y leí algunos artículos sobre ellos. Ahora estoy tratando de tener una mejor idea de cómo comparar los dos. Lo que he encontrado hasta ahora:
- LSTM funciona mejor si se trata de una gran cantidad de datos y hay suficientes datos de capacitación disponibles, mientras que ARIMA es mejor para conjuntos de datos más pequeños (¿es esto correcto?)
- ARIMA requiere una serie de parámetros
(p,q,d)
que deben calcularse en función de los datos, mientras que LSTM no requiere establecer dichos parámetros. Sin embargo, hay algunos hiperparámetros que necesitamos ajustar para LSTM. - EDITAR: Una diferencia importante entre los dos que noté al leer un gran artículo aquí , es que ARIMA solo podría funcionar bien en series de tiempo estacionarias (donde no hay estacionalidad, tendencia, etc.) y debe cuidar eso si quiere usar ARIMA
Aparte de las propiedades mencionadas anteriormente, no pude encontrar ningún otro punto o hecho que pudiera ayudarme a seleccionar el mejor modelo. Estaría realmente agradecido si alguien pudiera ayudarme a encontrar artículos, documentos u otras cosas (hasta ahora no tuve suerte, solo algunas opiniones generales aquí y allá y nada basado en experimentos).
Tengo que mencionar que originalmente estoy tratando con datos de transmisión, sin embargo, por ahora estoy usando conjuntos de datos NAB que incluyen 50 conjuntos de datos con el tamaño máximo de 20k puntos de datos.