Sí, ambos miden la exactitud de y e y_hat y sí, generalmente están correlacionados. A veces, la función de pérdida puede no ser la precisión, pero aún está interesado en medir la precisión, aunque no la esté optimizando directamente. El ejemplo MNIST TensorFlow de Google minimiza / optimiza la pérdida de entropía cruzada, pero muestra la precisión al usuario cuando informa los resultados, y esto está completamente bien.
A veces no desea optimizar la precisión directamente. Por ejemplo, si tiene un desequilibrio de clase serio, su modelo maximizará la precisión simplemente eligiendo siempre la clase más común, pero este no sería un modelo útil. En este caso, la entropía / pérdida de registro sería una mejor función de pérdida para optimizar.