He estado estudiando la arquitectura de la red neuronal siamesa introducida por Yann LeCun y sus colegas en 1994 para el reconocimiento de firmas ( "Verificación de firma usando una red neuronal siamesa de retardo de tiempo" .pdf , NIPS 1994)
Entendí la idea general de esta arquitectura, pero realmente no puedo entender cómo funciona la retropropagación en este caso. No puedo entender cuáles son los valores objetivo de la red neuronal, que permitirán que la retropropagación establezca adecuadamente los pesos de cada neurona.

En esta arquitectura, el algoritmo calcula la similitud del coseno entre las representaciones finales de las dos redes neuronales. El documento establece: "La salida deseada es para un ángulo pequeño entre las salidas de las dos subredes (f1 y f2) cuando se presentan firmas genuinas , y un gran ángulo si una de las firmas es una falsificación ".
Realmente no puedo entender cómo podrían usar una función binaria (similitud de coseno entre dos vectores) como objetivo para ejecutar la propagación hacia atrás.
¿Cómo se calcula la propagación hacia atrás en las redes neuronales siamesas?