Acabo de terminar de leer esta discusión. Argumentan que PR AUC es mejor que ROC AUC en el conjunto de datos desequilibrados.
Por ejemplo, tenemos 10 muestras en el conjunto de datos de prueba. 9 muestras son positivas y 1 es negativa. Tenemos un modelo terrible que predice todo lo positivo. Por lo tanto, tendremos una métrica que TP = 9, FP = 1, TN = 0, FN = 0.
Entonces, Precisión = 0.9, Recuperación = 1.0. La precisión y el recuerdo son muy altos, pero tenemos un clasificador pobre.
Por otro lado, TPR = TP / (TP + FN) = 1.0, FPR = FP / (FP + TN) = 1.0. Debido a que el FPR es muy alto, podemos identificar que este no es un buen clasificador.
Claramente, ROC es mejor que PR en conjuntos de datos desequilibrados. ¿Alguien puede explicar por qué las relaciones públicas son mejores?