Realmente una gran pregunta, y me parece que la mayoría de la gente realmente no entiende en un nivel intuitivo. AUCde hecho, a menudo se prefiere a la precisión para la clasificación binaria por varias razones diferentes. Primero, sin embargo, hablemos exactamente de lo que AUCes. Honestamente, por ser una de las métricas de eficacia más utilizadas, es sorprendentemente obtuso descubrir exactamente cómo AUCfunciona.
AUCrepresenta Area Under the Curve, ¿qué curva preguntas? Bueno, esa sería la ROCcurva. ROCsignifica Receptor Operating Characteristic , que en realidad es ligeramente no intuitivo. El objetivo implícito de AUCes lidiar con situaciones en las que tiene una distribución de muestra muy sesgada y no desea ajustarse a una sola clase.
Un gran ejemplo es la detección de spam. En general, los conjuntos de datos de spam tienen un fuerte sesgo hacia Ham o no spam. Si su conjunto de datos es del 90% de jamón, puede obtener una precisión bastante buena simplemente diciendo que cada correo electrónico es jamón, lo que obviamente es algo que indica un clasificador no ideal. Comencemos con un par de métricas que son un poco más útiles para nosotros, específicamente la tasa positiva verdadera ( TPR) y la tasa positiva falsa ( FPR):

Ahora, en este gráfico, TPRes específicamente la relación de verdadero positivo a todos los positivos, y FPRes la relación de falsos positivos a todos los negativos. (Tenga en cuenta que esto es solo para la clasificación binaria). En un gráfico como este, debería ser bastante sencillo darse cuenta de que una predicción de todos los 0 o todos los 1 dará como resultado los puntos de (0,0)y (1,1)respectivamente. Si dibujas una línea a través de estas líneas obtienes algo como esto:

Que se ve básicamente como una línea diagonal (lo es), y por alguna geometría fácil, se puede ver que la AUCde dicho modelo sería 0.5(altura y base son ambos 1). Del mismo modo, si predice un surtido aleatorio de 0 y 1, digamos 90% 1, podría obtener el punto (0.9, 0.9), que nuevamente cae a lo largo de esa línea diagonal.
Ahora viene la parte interesante. ¿Qué pasaría si no solo estuviéramos prediciendo 0 y 1? ¿Qué pasaría si, en cambio, quisiéramos decir que, en teoría, íbamos a establecer un límite, por encima del cual cada resultado era un 1, y por debajo del cual cada resultado era un 0. Esto significaría que en los extremos obtendría la situación original donde tienen todos los 0 y todos los 1 (con un límite de 0 y 1 respectivamente), pero también una serie de estados intermedios que se encuentran dentro del 1x1gráfico que contiene su ROC. En la práctica, obtienes algo como esto:

Básicamente, lo que realmente obtienes cuando haces una AUCprecisión excesiva es algo que desalentará a las personas a buscar modelos que sean representativos, pero no discriminatorios, ya que esto solo seleccionará en realidad modelos que logren tasas positivas falsas y verdaderas positivas. están significativamente por encima del azar, lo que no garantiza la precisión.