Preguntas etiquetadas con conv-neural-network

11
¿Por qué binary_crossentropy y categorical_crossentropy dan diferentes desempeños para el mismo problema?
Estoy tratando de entrenar a una CNN para clasificar el texto por tema. Cuando uso entropía cruzada binaria obtengo ~ 80% de precisión, con entropía cruzada categórica obtengo ~ 50% de precisión. No entiendo por qué es esto. Es un problema multiclase, ¿eso no significa que tengo que usar entropía …



9
¿Pedido de normalización y abandono de lotes?
La pregunta original se refería específicamente a las implementaciones de TensorFlow. Sin embargo, las respuestas son para implementaciones en general. Esta respuesta general también es la respuesta correcta para TensorFlow. Cuando utilizo la normalización y abandono por lotes en TensorFlow (específicamente usando contrib.layers), ¿debo preocuparme por el pedido? Parece posible …



7
¿Cómo decirle a Keras que deje de entrenar en función del valor de la pérdida?
Actualmente utilizo el siguiente código: callbacks = [ EarlyStopping(monitor='val_loss', patience=2, verbose=0), ModelCheckpoint(kfold_weights_path, monitor='val_loss', save_best_only=True, verbose=0), ] model.fit(X_train.astype('float32'), Y_train, batch_size=batch_size, nb_epoch=nb_epoch, shuffle=True, verbose=1, validation_data=(X_valid, Y_valid), callbacks=callbacks) Le dice a Keras que deje de entrenar cuando la pérdida no mejoró durante 2 épocas. Pero quiero dejar de entrenar después de que la …


1
ND Convolución Backprogation
Para mi educación, estoy tratando de implementar una capa convolucional N-dimensional en una red neuronal convolucional. Me gustaría implementar una función de retropropagación. Sin embargo, no estoy seguro de la forma más eficiente de hacerlo. Actualmente, estoy usando signal.fftconvolvepara: En el paso hacia adelante, convolucione el filtro y el kernel …

2
La pérdida no disminuye en Pytorch CNN
Estoy haciendo una CNN con Pytorch para una tarea, pero no aprenderá ni mejorará la precisión. Hice una versión trabajando con el conjunto de datos MNIST para poder publicarlo aquí. Solo estoy buscando una respuesta de por qué no funciona. La arquitectura está bien, la implementé en Keras y tenía …
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.