Realmente una gran pregunta, y me parece que la mayoría de la gente realmente no entiende en un nivel intuitivo. AUC
de hecho, a menudo se prefiere a la precisión para la clasificación binaria por varias razones diferentes. Primero, sin embargo, hablemos exactamente de lo que AUC
es. Honestamente, por ser una de las métricas de eficacia más utilizadas, es sorprendentemente obtuso descubrir exactamente cómo AUC
funciona.
AUC
representa Area Under the Curve
, ¿qué curva preguntas? Bueno, esa sería la ROC
curva. ROC
significa Receptor Operating Characteristic , que en realidad es ligeramente no intuitivo. El objetivo implícito de AUC
es lidiar con situaciones en las que tiene una distribución de muestra muy sesgada y no desea ajustarse a una sola clase.
Un gran ejemplo es la detección de spam. En general, los conjuntos de datos de spam tienen un fuerte sesgo hacia Ham o no spam. Si su conjunto de datos es del 90% de jamón, puede obtener una precisión bastante buena simplemente diciendo que cada correo electrónico es jamón, lo que obviamente es algo que indica un clasificador no ideal. Comencemos con un par de métricas que son un poco más útiles para nosotros, específicamente la tasa positiva verdadera ( TPR
) y la tasa positiva falsa ( FPR
):
Ahora, en este gráfico, TPR
es específicamente la relación de verdadero positivo a todos los positivos, y FPR
es la relación de falsos positivos a todos los negativos. (Tenga en cuenta que esto es solo para la clasificación binaria). En un gráfico como este, debería ser bastante sencillo darse cuenta de que una predicción de todos los 0 o todos los 1 dará como resultado los puntos de (0,0)
y (1,1)
respectivamente. Si dibujas una línea a través de estas líneas obtienes algo como esto:
Que se ve básicamente como una línea diagonal (lo es), y por alguna geometría fácil, se puede ver que la AUC
de dicho modelo sería 0.5
(altura y base son ambos 1). Del mismo modo, si predice un surtido aleatorio de 0 y 1, digamos 90% 1, podría obtener el punto (0.9, 0.9)
, que nuevamente cae a lo largo de esa línea diagonal.
Ahora viene la parte interesante. ¿Qué pasaría si no solo estuviéramos prediciendo 0 y 1? ¿Qué pasaría si, en cambio, quisiéramos decir que, en teoría, íbamos a establecer un límite, por encima del cual cada resultado era un 1, y por debajo del cual cada resultado era un 0. Esto significaría que en los extremos obtendría la situación original donde tienen todos los 0 y todos los 1 (con un límite de 0 y 1 respectivamente), pero también una serie de estados intermedios que se encuentran dentro del 1x1
gráfico que contiene su ROC
. En la práctica, obtienes algo como esto:
Básicamente, lo que realmente obtienes cuando haces una AUC
precisión excesiva es algo que desalentará a las personas a buscar modelos que sean representativos, pero no discriminatorios, ya que esto solo seleccionará en realidad modelos que logren tasas positivas falsas y verdaderas positivas. están significativamente por encima del azar, lo que no garantiza la precisión.