Preguntas etiquetadas con neural-networks

Las redes neuronales artificiales (ANN) son una amplia clase de modelos computacionales basados ​​libremente en redes neuronales biológicas. Abarcan NN de avance (incluidas las NN "profundas"), NN convolucionales, NN recurrentes, etc.

1
La pérdida de entrenamiento baja y sube de nuevo. ¿Que esta pasando?
Mi pérdida de entrenamiento baja y luego vuelve a subir. Es muy raro La pérdida de validación cruzada rastrea la pérdida de entrenamiento. Que esta pasando? Tengo dos LSTMS apilados de la siguiente manera (en Keras): model = Sequential() model.add(LSTM(512, return_sequences=True, input_shape=(len(X[0]), len(nd.char_indices)))) model.add(Dropout(0.2)) model.add(LSTM(512, return_sequences=False)) model.add(Dropout(0.2)) model.add(Dense(len(nd.categories))) model.add(Activation('sigmoid')) model.compile(loss='binary_crossentropy', …



8
¿Por qué es tan importante tener teorías de principios y matemáticas para el aprendizaje automático?
Me he estado preguntando, ¿por qué es tan importante tener un aprendizaje automático basado en principios / teórico? Desde una perspectiva personal como humano, puedo entender por qué el aprendizaje automático basado en principios sería importante: A los humanos les gusta entender lo que están haciendo, encontramos belleza y satisfacción …



6
Para problemas convexos, ¿el gradiente en Descenso de gradiente estocástico (SGD) siempre apunta al valor extremo global?
Dada una función de costo convexo, usando SGD para la optimización, tendremos un gradiente (vector) en un cierto punto durante el proceso de optimización. Mi pregunta es, dado el punto en el convexo, ¿el gradiente solo apunta en la dirección en que la función aumenta / disminuye más rápido, o …




3
¿Cuál es la razón por la que el Adam Optimizer se considera robusto al valor de sus hiperparámetros?
Estaba leyendo sobre el optimizador Adam para Deep Learning y encontré la siguiente oración en el nuevo libro Deep Learning de Bengio, Goodfellow y Courville: En general, se considera que Adam es bastante robusto para la elección de hiperparámetros, aunque a veces la tasa de aprendizaje debe cambiarse del valor …

4
¿Qué podemos aprender sobre el cerebro humano de las redes neuronales artificiales?
Sé que mi pregunta / título no es muy específico, así que intentaré aclararlo: Las redes neuronales artificiales tienen diseños relativamente estrictos. Por supuesto, en general, están influenciados por la biología e intentan construir un modelo matemático de redes neuronales reales, pero nuestra comprensión de las redes neuronales reales es …

2
Los codificadores automáticos no pueden aprender funciones significativas
Tengo 50,000 imágenes como estas dos: Representan gráficos de datos. Quería extraer características de estas imágenes, así que utilicé el código del codificador automático proporcionado por Theano (deeplearning.net). El problema es que estos autoencoders no parecen aprender ninguna característica. He intentado RBM y es lo mismo. El conjunto de datos …


2
¿Cuál es la diferencia entre dropout y drop connect?
¿Cuál es la diferencia entre dropout y drop connect? AFAIK, el abandono abandona aleatoriamente los nodos ocultos durante el entrenamiento, pero los mantiene en las pruebas, y desconecta y desconecta las conexiones. Pero, ¿no es dejar caer conexiones equivalente a dejar caer los nodos ocultos? ¿No son los nodos (o …

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.