En general, cuando tiene un problema en el que la muestra solo puede pertenecer a una clase entre un conjunto de clases, configura la última capa para que sea una capa soft-max. Le permite interpretar las salidas como probabilidades. Cuando se usa una capa soft-max, la entropía cruzada generalmente funciona muy bien, porque el término logarítmico en la entropía cruzada cancela la meseta que está presente en la función soft-max, por lo tanto, acelera el proceso de aprendizaje (piense en puntos muy lejanos). de en la función sigmoidea).0 0
En su caso, tiene una tarea de clasificación binaria, por lo tanto, su capa de salida puede ser el sigmoide estándar (donde la salida representa la probabilidad de que una muestra de prueba sea una cara). La pérdida que usaría sería la entropía cruzada binaria. Con esta configuración, puede imaginar tener una regresión logística en la última capa de su red neuronal profunda.
Aquí hay un par de enlaces para ti. Espero que ayuden.
https://en.wikipedia.org/wiki/Cross_entropy#Cross-entropy_error_function_and_logistic_regression
http://neuralnetworksanddeeplearning.com/chap3.html
https://www.quora.com/How-do-you-decide-which-loss- función-a-usar-para-machine-learning
sigmoid
(como la activación de la última capa). Gracias