Trabajo en un dominio problemático donde la gente suele informar ROC-AUC o AveP (precisión promedio). Sin embargo, recientemente encontré documentos que optimizan la pérdida de registro , mientras que otros informan pérdida de bisagra .
Si bien entiendo cómo se calculan estas métricas, me resulta difícil comprender las compensaciones entre ellas y cuál es bueno para qué exactamente.
Cuando se trata de ROC-AUC vs Precision-Recall, este hilo analiza cómo la maximización de ROC-AUC puede verse como el uso de un criterio de optimización de pérdidas que penaliza "clasificar un verdadero negativo al menos tan grande como un verdadero positivo" (suponiendo que más alto los puntajes corresponden a los positivos). Además, este otro hilo también proporciona una discusión útil de ROC-AUC en contraste con las métricas de Precision-Recall .
Sin embargo, ¿para qué tipo de problemas se preferiría la pérdida de registro sobre, por ejemplo, ROC-AUC , AveP o la pérdida de Bisagra ? Lo más importante, ¿qué tipo de preguntas debería hacerse sobre el problema al elegir entre estas funciones de pérdida para la clasificación binaria?