Estadísticas y Big Data tensorflow

6

Adam optimizer con decadencia exponencial

En la mayoría de los códigos de Tensorflow, he visto que Adam Optimizer se usa con una tasa de aprendizaje constante de 1e-4(es decir, 0,0001). El código generalmente tiene el siguiente aspecto: ...build the model... # Add the optimizer train_op = tf.train.AdamOptimizer(1e-4).minimize(cross_entropy) # Add the ops to initialize variables. These …

53 neural-networks deep-learning gradient-descent tensorflow adam

1

¿En qué se diferencia softmax_cross_entropy_with_logits de softmax_cross_entropy_with_logits_v2?

Específicamente, supongo que me pregunto acerca de esta declaración: Las futuras versiones principales de TensorFlow permitirán que los gradientes fluyan a la entrada de etiquetas en backprop de forma predeterminada. Que se muestra cuando lo uso tf.nn.softmax_cross_entropy_with_logits. En el mismo mensaje me insta a echar un vistazo tf.nn.softmax_cross_entropy_with_logits_v2. Revisé la …

41 machine-learning supervised-learning tensorflow backpropagation

3

Aprendizaje automático: ¿Debo usar una entropía cruzada categórica o una pérdida de entropía cruzada binaria para las predicciones binarias?

En primer lugar, me di cuenta de que si necesito realizar predicciones binarias, tengo que crear al menos dos clases a través de una codificación en caliente. ¿Es esto correcto? Sin embargo, ¿es la entropía cruzada binaria solo para predicciones con una sola clase? Si tuviera que usar una pérdida …

36 machine-learning neural-networks loss-functions tensorflow cross-entropy

5

Comprender las unidades LSTM frente a las células

He estado estudiando LSTM por un tiempo. Entiendo a alto nivel cómo funciona todo. Sin embargo, al implementarlos usando Tensorflow, he notado que BasicLSTMCell requiere un número de unidades (es decir num_units) parámetro. A partir de esta explicación muy detallada de los LSTM, he deducido que una sola unidad LSTM …

32 neural-networks terminology lstm rnn tensorflow

1

CNN arquitecturas para la regresión?

He estado trabajando en un problema de regresión donde la entrada es una imagen, y la etiqueta es un valor continuo entre 80 y 350. Las imágenes son de algunos químicos después de que ocurre una reacción. El color que resulta indica la concentración de otro químico que queda, y …

32 regression machine-learning neural-networks conv-neural-network tensorflow

3

Construyendo un autoencoder en Tensorflow para superar PCA

Hinton y Salakhutdinov en la reducción de la dimensionalidad de los datos con redes neuronales, Science 2006 propusieron un PCA no lineal mediante el uso de un autoencoder profundo. He intentado construir y entrenar un codificador automático de PCA con Tensorflow varias veces, pero nunca he podido obtener un mejor …

31 pca python deep-learning tensorflow autoencoders

1

Ejemplo paso a paso de diferenciación automática en modo inverso

No estoy seguro si esta pregunta pertenece aquí, pero está estrechamente relacionada con los métodos de gradiente en la optimización, que parece estar en el tema aquí. De todos modos, siéntase libre de migrar si cree que alguna otra comunidad tiene una mejor experiencia en el tema. En resumen, estoy …

27 optimization derivative tensorflow automatic-differentiation

2

Cómo ponderar la pérdida de KLD frente a la pérdida de reconstrucción en el codificador automático variacional

En casi todos los ejemplos de código que he visto de un VAE, las funciones de pérdida se definen de la siguiente manera (este es el código de tensorflow, pero he visto algo similar para theano, torch, etc.) También es para un convnet, pero eso tampoco es demasiado relevante , …

26 machine-learning deep-learning tensorflow autoencoders variational-bayes

1

¿Cómo se interpretan los histogramas proporcionados por TensorFlow en TensorBoard?

Recientemente estaba corriendo y aprendiendo el flujo del tensor y obtuve algunos histogramas que no sabía cómo interpretar. Por lo general, pienso en la altura de las barras como la frecuencia (o frecuencia / recuento relativo). Sin embargo, el hecho de que no haya barras como en un histograma habitual …

23 machine-learning neural-networks conv-neural-network tensorflow

3

Relu vs Sigmoid vs Softmax como neuronas de capa oculta

Estaba jugando con una red neuronal simple con una sola capa oculta, por Tensorflow, y luego probé diferentes activaciones para la capa oculta: Relu Sigmoideo Softmax (bueno, generalmente softmax se usa en la última capa ..) Relu ofrece la mejor precisión de tren y precisión de validación. No estoy seguro …

22 machine-learning neural-networks conv-neural-network tensorflow sigmoid-curve

1

Función de pérdida para autoencoders

Estoy experimentando un poco de autoencoders, y con tensorflow creé un modelo que intenta reconstruir el conjunto de datos MNIST. Mi red es muy simple: X, e1, e2, d1, Y, donde e1 y e2 son capas de codificación, d2 e Y son capas de decodificación (e Y es la salida …

21 mse autoencoders tensorflow cross-entropy

2

¿Cuál es la diferencia entre el inicializador de escala de varianza y el inicializador xavier?

En aplicación de la Tensorflow ResNet , encuentro que utilizan la variación de escala inicializador, también encuentro Xavier inicializador es popular. No tengo mucha experiencia en esto, ¿qué es mejor en la práctica?

20 machine-learning neural-networks deep-learning conv-neural-network tensorflow

5

Aprendizaje profundo: ¿Cómo sé qué variables son importantes?

En términos de jerga de redes neuronales (y = Peso * x + sesgo), ¿cómo sabría qué variables son más importantes que otras? Tengo una red neuronal con 10 entradas, 1 capa oculta con 20 nodos y 1 capa de salida que tiene 1 nodo. No estoy seguro de cómo …

20 machine-learning neural-networks bias tensorflow theano

3

Diferencia entre muestras, pasos de tiempo y características en la red neuronal

Estoy leyendo el siguiente blog sobre la red neuronal LSTM: http://machinelearningmastery.com/understanding-stateful-lstm-recurrent-neural-networks-python-keras/ El autor da nueva forma al vector de entrada X como [muestras, pasos de tiempo, características] para diferentes configuraciones de LSTM. El autor escribe De hecho, las secuencias de letras son pasos de tiempo de una característica en lugar …

17 neural-networks lstm rnn tensorflow tensor

4

¿Es posible dar imágenes de tamaño variable como entrada a una red neuronal convolucional?

¿Podemos dar imágenes con tamaño variable como entrada a una red neuronal convolucional para la detección de objetos? Si es posible, ¿cómo podemos hacer eso? Pero si tratamos de recortar la imagen, perderemos una parte de la imagen y si tratamos de cambiar el tamaño, se perderá la claridad de …

17 deep-learning tensorflow keras computer-vision object-detection

Preguntas etiquetadas con tensorflow