La pregunta es bastante vaga, así que voy a suponer que desea elegir una medida de rendimiento adecuada para comparar diferentes modelos. Para obtener una buena visión general de las diferencias clave entre las curvas ROC y PR, puede consultar el siguiente documento: La relación entre recuperación de precisión y curvas ROC de Davis y Goadrich .
Para citar a Davis y Goadrich:
Sin embargo, cuando se trata de conjuntos de datos muy asimétricos, las curvas de recuperación de precisión (PR) ofrecen una imagen más informativa del rendimiento de un algoritmo.
FPR=FPFP+TN,TPR=TPTP+FN.
recall=TPTP+FN=TPR,precision=TPTP+FP
FP
Las curvas de recuperación de precisión son mejores para resaltar las diferencias entre modelos para conjuntos de datos altamente desequilibrados. Si desea comparar diferentes modelos en configuraciones desequilibradas, el área bajo la curva PR probablemente exhibirá mayores diferencias que el área bajo la curva ROC.
Dicho esto, las curvas ROC son mucho más comunes (incluso si son menos adecuadas). Dependiendo de su audiencia, las curvas ROC pueden ser la lengua franca, por lo que usarlas es probablemente la opción más segura. Si un modelo domina completamente a otro en el espacio PR (por ejemplo, siempre tiene una mayor precisión en todo el rango de recuperación), también dominará en el espacio ROC. Si las curvas se cruzan en cualquier espacio, también se cruzarán en el otro. En otras palabras, las conclusiones principales serán similares sin importar qué curva use.
Anuncio descarado . Como ejemplo adicional, podría echar un vistazo a uno de mis documentos en el que informo de las curvas ROC y PR en un entorno desequilibrado. La Figura 3 contiene curvas ROC y PR para modelos idénticos, mostrando claramente la diferencia entre los dos. Para comparar el área bajo PR versus el área bajo ROC, puede comparar las tablas 1-2 (AUPR) y las tablas 3-4 (AUROC) donde puede ver que AUPR muestra diferencias mucho mayores entre modelos individuales que AUROC. Esto enfatiza la idoneidad de las curvas PR una vez más.