Como expliqué en mi comentario sobre su otra pregunta, step
usa AIC en lugar de valores p.
Sin embargo, para una sola variable a la vez, AIC hace corresponden al uso de un valor de p de 0,15 (o para ser más precisos, 0,1573):
Considere comparar dos modelos, que difieren en una sola variable. Llame a los modelos (modelo más pequeño) y M 1 (modelo más grande), y deje que sus AIC sean AIC 0 y AIC 1 respectivamente.METRO0 0METRO1AIC0 0AIC1
Usando el criterio AIC, usaría el modelo más grande si . Este será el caso si - 2 log L 0 - ( - 2 log L 1 ) > 2 .AIC1< AIC0 0- 2 logL0 0- ( - 2 logL1) > 2
Pero esta es simplemente la estadística en una prueba de razón de probabilidad. Del teorema de Wilks, rechazaremos el nulo si el estadístico excede el cuantil superior de a χ 2 1 . Entonces, si usamos una prueba de hipótesis para elegir entre el modelo más pequeño y el más grande, elegimos el modelo más grande cuando - 2 log L 0 - ( - 2 log L 1 ) > C α .αχ21- 2 logL0 0- ( - 2 logL1) > Cα
Ahora encuentra en el percentil 84.27 de un χ 2 1 . Por lo tanto, si elegimos el modelo más grande cuando tiene un AIC más pequeño, esto corresponde a rechazar la hipótesis nula para una prueba del término adicional con un valor p de 1 - 0.843 = 0.157 , o 15.7 %2χ211 - 0.843 = 0.15715,7 %
Entonces, ¿cómo lo modificas?
Fácil. Cambie el k
parámetro step
de 2 a otra cosa. ¿Quieres un 10% en su lugar? Hazlo 2.7:
qchisq(0.10,1,lower.tail=FALSE)
[1] 2.705543
¿Quieres un 2,5%? Conjunto k=5
:
qchisq(0.025,1,lower.tail=FALSE)
[1] 5.023886
y así.
Sin embargo, a pesar de que eso resuelve su pregunta, le aconsejo que preste mucha atención a la respuesta de Frank Harrell sobre su otra pregunta, y que busque respuestas de muchos estadísticos sobre otras preguntas relacionadas con la regresión gradual aquí, qué consejo tiende a ser muy consistentemente para evitar procedimientos escalonados en general.