Programación deep-learning

4

Arquitectura de perceptrón multicapa (MLP): ¿criterios para elegir el número de capas ocultas y el tamaño de la capa oculta?

Si tenemos 10 vectores propios, entonces podemos tener 10 nodos neuronales en la capa de entrada. Si tenemos 5 clases de salida, entonces podemos tener 5 nodos en la capa de salida. Pero, ¿cuál es el criterio para elegir el número de capas ocultas en un MLP y cuántos neurales? …

104 machine-learning neural-network deep-learning perceptron

1

¿Qué parámetros deben utilizarse para la parada anticipada?

Estoy entrenando una red neuronal para mi proyecto usando Keras. Keras ha proporcionado una función para detenerse temprano. ¿Puedo saber qué parámetros deben observarse para evitar que mi red neuronal se sobreajuste mediante la detención anticipada?

97 python keras deep-learning conv-neural-network

6

¿Cómo aplicar el recorte de degradado en TensorFlow?

Considerando el código de ejemplo . Me gustaría saber cómo aplicar el recorte de gradiente en esta red en el RNN donde existe la posibilidad de explosiones de gradientes. tf.clip_by_value(t, clip_value_min, clip_value_max, name=None) Este es un ejemplo que podría usarse, pero ¿dónde lo introduzco? En la def de RNN lstm_cell …

96 python machine-learning tensorflow deep-learning lstm

6

Usar una inserción de palabras previamente entrenadas (word2vec o Glove) en TensorFlow

Recientemente revisé una implementación interesante para la clasificación de texto convolucional . Sin embargo, todo el código de TensorFlow que he revisado utiliza vectores de incrustación aleatorios (no entrenados previamente) como los siguientes: with tf.device('/cpu:0'), tf.name_scope("embedding"): W = tf.Variable( tf.random_uniform([vocab_size, embedding_size], -1.0, 1.0), name="W") self.embedded_chars = tf.nn.embedding_lookup(W, self.input_x) self.embedded_chars_expanded = …

95 python numpy tensorflow deep-learning

10

¿Cómo agregar regularizaciones en TensorFlow?

Encontré en muchos códigos de redes neuronales disponibles implementados con TensorFlow que los términos de regularización a menudo se implementan agregando manualmente un término adicional al valor de pérdida. Mis preguntas son: ¿Existe una forma de regularización más elegante o recomendada que hacerlo manualmente? También encuentro que get_variabletiene un argumento …

94 python neural-network tensorflow deep-learning

5

¿Por qué “empaquetamos” las secuencias en pytorch?

Estaba tratando de replicar Cómo usar el empaquetado para entradas de secuencia de longitud variable para rnn, pero supongo que primero necesito entender por qué necesitamos "empaquetar" la secuencia. Entiendo por qué tenemos que "rellenarlos", pero ¿por qué es necesario "empacar" pack_padded_sequence? ¡Cualquier explicación de alto nivel será apreciada!

93 deep-learning pytorch recurrent-neural-network tensor zero-padding

6

PyTorch - contiguo ()

Estaba revisando este ejemplo de un modelo de lenguaje LSTM en github (enlace) . Lo que hace en general me queda bastante claro. Pero todavía estoy luchando por entender qué contiguous()hace la llamada , lo que ocurre varias veces en el código. Por ejemplo, en la línea 74/75 de la …

90 neural-network deep-learning lstm pytorch contiguous

5

¿Cuál es el uso de verbose en Keras al validar el modelo?

Estoy ejecutando el modelo LSTM por primera vez. Aquí está mi modelo: opt = Adam(0.002) inp = Input(...) print(inp) x = Embedding(....)(inp) x = LSTM(...)(x) x = BatchNormalization()(x) pred = Dense(5,activation='softmax')(x) model = Model(inp,pred) model.compile(....) idx = np.random.permutation(X_train.shape[0]) model.fit(X_train[idx], y_train[idx], nb_epoch=1, batch_size=128, verbose=1) ¿Cuál es el uso de verbose durante …

89 python deep-learning keras verbose

4

¿Qué significa global_step en Tensorflow?

En este es el código del tutorial del sitio web de TensorFlow, ¿Alguien podría ayudar a explicar lo que global_stepsignifica? Encontré en el sitio web de Tensorflow escrito que el paso global se usa para contar los pasos de entrenamiento , pero no entiendo qué significa exactamente. Además, ¿qué significa …

88 tensorflow deep-learning

2

¿Cómo formatear los datos de la imagen para entrenamiento / predicción cuando las imágenes son de diferente tamaño?

Estoy tratando de entrenar mi modelo que clasifica imágenes. El problema que tengo es que tienen diferentes tamaños. ¿Cómo debo formatear mis imágenes / modelo de arquitectura?

88 deep-learning

5

Keras, ¿cómo puedo predecir después de entrenar un modelo?

Estoy jugando con el conjunto de datos de ejemplo de Reuters y funciona bien (mi modelo está entrenado). Leí sobre cómo guardar un modelo, para poder cargarlo más tarde para usarlo nuevamente. Pero, ¿cómo utilizo este modelo guardado para predecir un nuevo texto? Lo uso models.predict()? ¿Tengo que preparar este …

87 python theano deep-learning keras

5

Causas comunes de nans durante el entrenamiento

He notado que se NANestá introduciendo una ocurrencia frecuente durante el entrenamiento . A menudo, parece ser introducido por pesos en capas de producto interno / completamente conectadas o de convolución que explotan. ¿Esto ocurre porque el cálculo del gradiente está explotando? ¿O se debe a la inicialización del peso …

85 machine-learning neural-network deep-learning caffe gradient-descent

4

¿Cómo descomprimir el archivo pkl?

Tengo un archivo pkl del conjunto de datos MNIST, que consta de imágenes de dígitos escritas a mano. Me gustaría echar un vistazo a cada una de esas imágenes de dígitos, así que necesito descomprimir el archivo pkl, excepto que no puedo averiguar cómo. ¿Hay alguna forma de descomprimir / …

83 python pickle deep-learning mnist

1

¿Cuál es el papel de la capa TimeDistributed en Keras?

Estoy tratando de comprender qué hace el contenedor TimeDistributed en Keras. Entiendo que TimeDistributed "aplica una capa a cada segmento temporal de una entrada". Pero hice un experimento y obtuve resultados que no puedo entender. En resumen, en relación con la capa LSTM, TimeDistributed y solo la capa Dense dan …

82 python machine-learning keras neural-network deep-learning

9

¿Cómo asignar un valor a una variable de TensorFlow?

Estoy tratando de asignar un nuevo valor a una variable tensorflow en Python. import tensorflow as tf import numpy as np x = tf.Variable(0) init = tf.initialize_all_variables() sess = tf.InteractiveSession() sess.run(init) print(x.eval()) x.assign(1) print(x.eval()) Pero el resultado que obtengo es 0 0 Entonces el valor no ha cambiado. ¿Qué me …

79 python tensorflow neural-network deep-learning variable-assignment

Preguntas etiquetadas con deep-learning