Estoy tratando de entender el origen de la forma curva de las bandas de confianza asociadas con una regresión lineal OLS y cómo se relaciona con los intervalos de confianza de los parámetros de regresión (pendiente e intercepción), por ejemplo (usando R):
require(visreg)
fit <- lm(Ozone ~ Solar.R,data=airquality)
visreg(fit)
Parece que la banda está relacionada con los límites de las líneas calculadas con la intersección del 2.5% y la pendiente del 97.5%, así como con la intersección del 97.5% y la pendiente del 2.5% (aunque no del todo):
xnew <- seq(0,400)
int <- confint(fit)
lines(xnew, (int[1,2]+int[2,1]*xnew))
lines(xnew, (int[1,1]+int[2,2]*xnew))
Lo que no entiendo son dos cosas:
- ¿Qué pasa con la combinación de 2.5% de pendiente y 2.5% de intercepción, así como 97.5% de pendiente y 97.5% de intercepción? Estos dan líneas que están claramente fuera de la banda trazada arriba. Tal vez no entiendo el significado de un intervalo de confianza, pero si en el 95% de los casos mis estimaciones están dentro del intervalo de confianza, ¿esto parece un posible resultado?
- ¿Qué determina la distancia mínima entre el límite superior y el inferior (es decir, cerca del punto donde las dos líneas agregadas arriba interceptan)?
Supongo que ambas preguntas surgen porque no sé / entiendo cómo se calculan realmente estas bandas.
¿Cómo puedo calcular los límites superior e inferior utilizando los intervalos de confianza de los parámetros de regresión (sin depender de predic () o una función similar, es decir, a mano)? Traté de descifrar la función predict.lm en R, pero la codificación me supera. Agradecería cualquier sugerencia sobre literatura relevante o explicaciones adecuadas para principiantes en estadísticas.
Gracias.