En general, no hay pautas sobre cómo determinar el número de capas o el número de celdas de memoria en un LSTM.
El número de capas y celdas requeridas en un LSTM puede depender de varios aspectos del problema:
La complejidad del conjunto de datos. La cantidad de características, número de puntos de datos, etc.
El proceso de generación de datos. El siguiente ejemplo de cómo el proceso de generación de datos puede desempeñar un papel importante.
Ex: predicción de los precios del petróleo en comparación con la predicción del PIB de una economía bien entendida. El último es mucho más fácil que el primero. Por lo tanto, la predicción de los precios del petróleo también podría necesitar un mayor número de celdas de memoria LSTM para predecir con la misma precisión en comparación con el PIB.
- La precisión requerida para el caso de uso. El número de celdas de memoria dependerá en gran medida de esto. Si el objetivo es superar el estado del arte, se necesitan más celdas LSTM en general. Compare eso con el objetivo de llegar a predicciones razonables, que necesitarían un menor número de celdas LSTM.
Sigo estos pasos cuando modelo usando LSTM:
Pruebe con una sola capa oculta con 2 o 3 celdas de memoria. Vea cómo funciona en comparación con un punto de referencia. Si se trata de un problema de series de tiempo, generalmente hago un pronóstico de las técnicas clásicas de series de tiempo como punto de referencia.
Intenta aumentar el número de celdas de memoria. Si el rendimiento no aumenta mucho, pase al siguiente paso.
Comience a profundizar la red, es decir, agregue otra capa con un pequeño número de celdas de memoria.
Aparte:
No hay límite para la cantidad de trabajo que se puede dedicar a alcanzar esos mínimos globales de la función de pérdida y ajustar los mejores hiperparámetros. Por lo tanto, centrarse en el objetivo final del modelado debería ser la estrategia en lugar de tratar de aumentar la precisión tanto como sea posible.
La mayoría de los problemas se pueden manejar usando 2-3 capas de la red.