RNN
A las arquitecturas les gusta LSTM
y BiLSTM
se usan en ocasiones en las que el problema de aprendizaje es secuencial, por ejemplo, si tiene un video y desea saber de qué se trata todo esto o si desea que un agente lea una línea de documento para usted, que es una imagen de texto y No en formato de texto. Le recomiendo que eche un vistazo aquí .
LSTMs
y sus variantes bidireccionales son populares porque han tratado de aprender cómo y cuándo olvidar y cuándo no usar puertas en su arquitectura. En RNN
arquitecturas anteriores , la desaparición de los gradientes era un gran problema y hacía que esas redes no aprendieran tanto.
Con Bidireccional LSTMs
, alimenta el algoritmo de aprendizaje con los datos originales una vez de principio a fin y una vez de principio a fin. Aquí hay debates, pero generalmente se aprende más rápido que el enfoque unidireccional, aunque depende de la tarea.
Sí, también puede usarlos en el aprendizaje no supervisado según su tarea. mira aquí y aquí .