Una comparación de los métodos de intervalos de confianza en un ejemplo de ISL
El libro "Introducción al aprendizaje estadístico" de Tibshirani, James, Hastie proporciona un ejemplo en la página 267 de intervalos de confianza para el grado de regresión logística polinómica 4 en los datos salariales . Citando el libro:
Modelamos el evento binario usando regresión logística con un polinomio de grado 4. La probabilidad posterior ajustada de salario superior a $ 250,000 se muestra en azul, junto con un intervalo de confianza del 95% estimado.w a ge > 250
A continuación se muestra un resumen rápido de dos métodos para construir tales intervalos, así como comentarios sobre cómo implementarlos desde cero
Intervalos de transformación de Wald / Endpoint
- Calcule los límites superior e inferior del intervalo de confianza para la combinación lineal (utilizando el CI de Wald)XTβ
- Aplique una transformación monotónica a los puntos finales para obtener las probabilidades.F( xTβ)
Dado que es una transformación monotónica dex T βPAGr ( xTβ) = F( xTβ)XTβ
[ Pr ( xTβ)L≤ Pr ( xTβ) ≤ Pr ( xTβ)U] = [ F( xTβ)L≤ F( xTβ) ≤ F( xTβ)U]
Concretamente, esto significa calcular y luego aplicar la transformación logit al resultado para obtener los límites inferior y superior:βTx ± z∗Smi( βTx )
[ eXTβ- z∗Smi( xTβ)1 + eXTβ- z∗Smi( xTβ), eXTβ+ z∗Smi( xTβ)1 + eXTβ+ z∗Smi( xTβ), ]
Calculando el error estándar
La teoría de máxima verosimilitud nos dice que la varianza aproximada de se puede calcular usando la matriz de covarianza de los coeficientes de regresión usandoXTβΣ
Va r ( xTβ) = xTΣ x
Defina la matriz de diseño y la matriz comoXV
X = ⎡⎣⎢⎢⎢⎢⎢11⋮1X1 , 1X2 , 1⋮Xn , 1......⋱...X1 , pX2 , p⋮Xn , p⎤⎦⎥⎥⎥⎥⎥ V = ⎡⎣⎢⎢⎢⎢⎢π^1( 1 - π^1)0 0⋮0 00 0π^2( 1 - π^2)⋮0 0......⋱...0 00 0⋮π^norte( 1 - π^norte)⎤⎦⎥⎥⎥⎥⎥
donde es el valor de la ésimo variable para los th observaciones y representa la probabilidad predicha para la observación .Xi , jjyoπ^yoyo
La matriz de covarianza se puede encontrar como: y el error estándar comoΣ = (XTV X)- 1Smi( xTβ) = Va r ( xTβ)--------√
Los intervalos de confianza del 95% para la probabilidad pronosticada se pueden representar como
Intervalos de confianza del método Delta
El enfoque consiste en calcular la varianza de una aproximación lineal de la función y usarla para construir intervalos de confianza de muestra grandes.F
Var [ F( xTβ^) ]≈∇ FT Σ ∇ F
Donde es el gradiente y la matriz de covarianza estimada. Tenga en cuenta que en una dimensión: ∇Σ
∂F(xβ)∂β=∂F(xβ)∂xβ∂xβ∂β=xf(xβ)
Donde es la derivada de . Esto se generaliza en el caso multivariante.fF
Var[F(xTβ^)]≈fT xT Σ x f
En nuestro caso, F es la función logística (que denotaremos ) cuya derivada esπ(xTβ)
π′(xTβ)=π(xTβ)(1−π(xTβ))
Ahora podemos construir un intervalo de confianza utilizando la varianza calculada anteriormente.
C.I.=[Pr(xβ^)−z∗Var[π(xβ^)]−−−−−−−−−√≤Pr(xβ^)+z∗Var[π(xβ^)]−−−−−−−−−√]
En forma vectorial para el caso multivariante
C.I.=[π(xTβ^)±z∗(π(xTβ^)(1−π(xTβ^)))TxT Var[β^] x π(xTβ^)(1−π(xTβ^))]−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−√
- Tenga en cuenta que representa un único punto de datos en , es decir, una sola fila de la matriz de diseñoR p + 1 XxRp+1X
Una conclusión abierta
Una mirada a las gráficas de QQ normal tanto para las probabilidades como para las probabilidades de registro negativas muestra que ninguna de las dos se distribuye normalmente. ¿Podría esto explicar la diferencia?
Fuente: