Estoy usando un clasificador que devuelve probabilidades. Para calcular el AUC, estoy usando el paquete pROC R. Las probabilidades de salida del clasificador son:
probs=c(0.9865780,
0.9996340,
0.9516880,
0.9337157,
0.9778576,
0.8140116,
0.8971550,
0.8967585,
0.6322902,
0.7497237)
probs
muestra la probabilidad de estar en la clase '1'. Como se muestra, el clasificador ha clasificado todas las muestras en la clase '1'.
El verdadero vector de etiqueta es:
truel=c(1, 1, 1, 1, 1, 0, 0, 0, 0, 0)
Como se muestra, el clasificador ha clasificado erróneamente 5 muestras. Pero, AUC es:
pROC::auc(truel, probs)
Area under the curve: 1
¿Podría explicarme por qué sucede?