Me refiero a la pregunta y sus respuestas: ¿Cómo comparar la capacidad predictiva (probabilidad) de los modelos desarrollados a partir de la regresión logística? por @Clark Chong y respuestas / comentarios por @Frank Harrell. ya la pregunta Grados de libertad de en la prueba de Hosmer-Lemeshow y los comentarios.
He leído el artículo DW Hosmer, T. Hosmer, S. Le Cessie, S. Lemeshow, "Una comparación de las pruebas de bondad de ajuste para el modelo de regresión logística", Estadísticas en Medicina, vol. 16, 965-980 (1997) .
Después de leer, estaba confundido porque la pregunta a la que me refería pide explícitamente la "capacidad predictiva (de probabilidad)", que en mi opinión no es lo mismo a lo que apuntan las pruebas de bondad de ajuste en el artículo supra:
Como la mayoría de nosotros sabemos, la regresión logística supone un enlace en forma de S entre las variables explicativas y la probabilidad de éxito, la forma funcional para la forma de S es
Sin pretender que no haya fallas en la prueba de Hosmer-Lemeshow, creo que tenemos que distinguir entre las pruebas para la (a) 'capacidad predictiva (probabilidad) ' y (b) ' bondad de ajuste '.
El objetivo del primero es probar si las probabilidades están bien predichas, mientras que las pruebas de bondad de ajuste prueban si la función en forma de S anterior es la función "correcta". Más formalmente:
- las pruebas para 'pruebas de habilidad predictiva de probabilidad' tienen un que indica que el modelo predice bien las probabilidades de éxito;
- mientras que para las pruebas de bondad de ajuste es (ver Hosmer et al.) que la forma funcional en forma de S supra es la correcta. Hosmer y col. realizan simulaciones donde encuentran el poder de detectar dos tipos de desviaciones del valor nulo, a saber, que la función de enlace es incorrecta o que el exponente en el denominador no es lineal.
Obviamente, si la función anterior tiene la forma funcional 'correcta' (por lo tanto, si las pruebas concluyen que podemos aceptar para la prueba de bondad de ajuste), entonces las probabilidades predichas estarán bien, ...
Primer comentario
... sin embargo, aceptar es una conclusión débil como se explica en ¿Qué sigue si no rechazamos la hipótesis nula? .
Primera pregunta
La pregunta / observación más importante que tengo es que si se rechaza la bondad de ajuste , entonces la conclusión de la prueba es que la forma funcional no era la `` correcta '', sin embargo, esto implica que las probabilidades son no está bien predicho?
Segunda pregunta
Además, quiero señalar las conclusiones de Hosmer et. Alabama; (Cito del resumen):
'' Un examen del desempeño de las pruebas cuando el modelo correcto tiene un término cuadrático pero un modelo que contiene solo el término lineal ha sido ajustado muestra que el chi-cuadrado de Pearson, la suma de cuadrados no ponderada, el decil de Hosmer-Lemeshow de riesgo, la suma de cuadrados residuales suavizados y la prueba de puntuación de Stukel tienen una potencia superior al 50% para detectar desviaciones moderadas de la linealidad cuando el tamaño de la muestra es 100 y tienen una potencia superior al 90% para estas mismas alternativas para muestras de tamaño 500 Todas las pruebas no tenían poder cuando el modelo correcto tenía una interacción entre una covariable dicotómica y continua, pero solo se ajustaba el modelo de covariable continua. El poder para detectar un enlace especificado incorrectamente era deficiente para muestras de tamaño 100. Para muestras de tamaño 500 Stukel ' La prueba de puntaje tuvo la mejor potencia, pero solo superó el 50 por ciento para detectar una función de enlace asimétrico. El poder de la prueba de suma de cuadrados no ponderada para detectar una función de enlace especificada incorrectamente fue ligeramente menor que la prueba de puntaje de Stukel ''
¿Puedo concluir a partir de esto qué prueba tiene más potencia o que Hosmer-Lemeshow tiene menos potencia (para detectar estas anomalías específicas)?
Segunda observación
El artículo de Hosmer et. Alabama. que mencioné anteriormente, calcule (simule) la potencia para detectar anomalías específicas (la potencia solo se puede calcular si se especifica un ). En mi opinión, esto no implica que estos resultados se puedan generalizar a '' todas las alternativas posibles ''?H 1