¿Cómo calcular el intervalo de predicción para una regresión múltiple de OLS?


Respuestas:


31

Tome un modelo de regresión con observaciones y regresores: \ mathbf {y = X \ beta + u} \ newcommand {\ Var} {\ rm Var}Nk

y=Xβ+u

Dado un vector x0 , el valor predicho para esa observación sería

E[y|x0]=y^0=x0β^.
Un estimador consistente de la varianza de esta predicción es
V^p=s2x0(XX)1x0,
donde
s2=Σi=1Nu^i2Nk.
El error de pronóstico para un y0 particular es
e^=y0y^0=x0β+u0y^0.
La covarianza cero entre u0 y β^ implica que
Var[e^]=Var[y^0]+Var[u0],
y un estimador consistente de eso es
V^f=s2x0(XX)1x0+s2.

El intervalo de confianza 1α confidence será:

y0±t1α/2V^p.
El intervalo de predicción 1α prediction será más amplio:
y0±t1α/2V^f.


La respuesta anterior está muy bien hecha, pero creo que esta fuente ayuda a proporcionar un contexto a la pregunta.
June Skeeter

@ Dimitriy Creo que tu segunda ecuación debería tener una zanahoria / sombrero, '^', sobre el . β
Don Slowik

¿No es el error de pronóstico el residual: ? e^=u^
Don Slowik
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.