AUC en regresión logística ordinal

Estoy usando 2 tipos de regresión logística: uno es el tipo simple, para la clasificación binaria, y el otro es la regresión logística ordinal. Para calcular la precisión del primero, utilicé la validación cruzada, donde calculé el AUC para cada pliegue y luego calculé el AUC medio. ¿Cómo puedo hacerlo para la regresión logística ordinal? He oído hablar de ROC generalizado para predictores de clases múltiples, pero no estoy seguro de cómo calcularlo.

¡Gracias!

— Noam pelado
fuente

no AUC pero relacionado: en curvas de recuperación de precisión micro / macro en stats.stackexchange.com/questions/21551/…

— Yevgeny

Respuestas:

Solo me gusta el área bajo la curva ROC ( índice- ) porque resulta ser una probabilidad de concordancia. es un bloque de construcción de coeficientes de correlación de rango. Por ejemplo, Somers ' . Para el ordinal , es una excelente medida de discriminación predictiva, y el paquete R proporciona formas fáciles de obtener estimaciones de corregidas por . Puede realizar una resolución inversa para un índice generalizado (AUROC generalizado). Hay razones para no considerar cada nivel de por separado, porque esto no se aprovecha de la naturaleza ordinal de . $c$ $c$ $D_{xy} = 2\times (c - \frac{1}{2})$ $Y$ $D_{xy}$ rms $D_{xy}$ $c$ $Y$ $Y$

En rmshay dos funciones para la regresión ordinal: lrmy orm, este último manipulación continua y proporcionando más familias de distribución (Funciones de enlace) que probabilidades proporcionales. $Y$

— Frank Harrell
fuente

El problema principal será ¿cómo calcula rms el utilizado en Sommer ?

c - i n d e x

$c-index$

D_{x y}

$D_{xy}$

— Chamberlain Foncha

Se deletrea Somer . El índice generalizado se calcula simplemente resolviendo la ecuación que enumeré anteriormente. Interna, se examinan todas las combinaciones posibles de observaciones que tienen diferentes valores de , y la fracción de dichos pares para los cuales las predicciones están en el mismo orden es la estimación de la probabilidad de concordancia. Cometí mal una cosa: la función utiliza Spearman lugar de .

c

$c$

Y

$Y$ orm

ρ

$\rho$

D_{x y}

$D_{xy}$

— Frank Harrell

Gracias por la corrección ortográfica. En la regresión ordinal será mucho más interesante no solo observar el ordenamiento por pares como se hace en la función orm que mencionó, sino también observar el ordenamiento consistente (con operadores ternarios o superiores) dependiendo del número de clases que tenga. En resumen, lo que estoy diciendo es: con una regresión logística acumulativa ajustada, por ejemplo, el orden de las clases se tiene en cuenta en el modelo. Una medida predictiva también debería ser capaz de no hacer una comparación por pares sino una comparación de la forma $ P (pred_1 <pred_2 <pred_3 | obs_1 <obs_2 <o

P (p r e d_{1} < p r e d_{2} | o b s_{1} < o b s_{2})

$P(pred_1<pred_2|obs_1<obs_2)$

— Chamberlain Foncha

Sin saber acerca de tales medidas, mi primera reacción es que están estableciendo una barra alta para obstaculizar.

— Frank Harrell

AUC para la regresión ordinal es algo complicado. Es posible que desee calcular el AUC para cada clase creando dummies para tomar el valor 1 para la clase que está calculando el AUC y 0 para el resto de las otras clases. Si tiene 4 clases, creará 4 AUC y las trazará en el mismo gráfico. El principal problema con este método es el hecho de que penaliza la clasificación errónea por igual. Mucho más intuitivamente la clasificación errónea de una clase 1 en la clase 3 debería ser peor que la clasificación errónea de la clase 1 en la clase 2.

— Chamberlain Foncha
fuente