Preguntas etiquetadas con lstm

Una memoria a corto y largo plazo (LSTM) es una arquitectura de red neuronal que contiene bloques NN recurrentes que pueden recordar un valor durante un período de tiempo arbitrario.




2
Diferencia entre una sola unidad LSTM y una red neuronal LSTM de 3 unidades
El LSTM en el siguiente código Keras input_t = Input((4, 1)) output_t = LSTM(1)(input_t) model = Model(inputs=input_t, outputs=output_t) print(model.summary()) puede ser representado como Entiendo que cuando llamamos a model.predict(np.array([[[1],[2],[3],[4]]]))la (única) unidad LSTM, primero se procesa el vector [1], luego [2] más la retroalimentación de la entrada anterior y así sucesivamente …


2
La mejor manera de inicializar el estado LSTM
Me preguntaba cuál es la mejor manera de inicializar el estado para LSTM. Actualmente solo lo inicializo a todos ceros. Realmente no puedo encontrar nada en línea sobre cómo inicializarlo. Una cosa que estaba pensando hacer es hacer que el estado inicial sea un parámetro entrenable. ¿Algún consejo?

1
Comprender la topología de LSTM
Como muchos otros lo han hecho, descubrí que los recursos aquí y aquí son inmensamente útiles para comprender las células LSTM. Estoy seguro de que entiendo cómo fluyen y se actualizan los valores, y estoy lo suficientemente seguro como para agregar las "conexiones de mirilla" mencionadas, etc. también. En mi …



3
Estructura de la red neuronal recurrente (LSTM, GRU)
Estoy tratando de entender la arquitectura de los RNN. He encontrado este tutorial que ha sido muy útil: http://colah.github.io/posts/2015-08-Understanding-LSTMs/ Especialmente esta imagen: ¿Cómo encaja esto en una red de retroalimentación? ¿Es esta imagen solo otro nodo en cada capa?

2
¿Cuál es la salida de un tf.nn.dynamic_rnn ()?
No estoy seguro de lo que entiendo de la documentación oficial, que dice: Devuelve: Un par (salidas, estado) donde: outputs: El tensor de salida RNN. Si time_major == False(por defecto), esta será la forma de un tensor: [batch_size, max_time, cell.output_size]. Si time_major == True, esta será una forma Tensor: [max_time, …


Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.