Sin ninguna pérdida de generalidad conceptual (o práctica), primero elimine la constante de las variables como se describe en Cómo exactamente se "controla para otras variables" . Sea el regresor, el error, la respuesta, la estimación de mínimos cuadrados de , y los residuos. Todos estos vectores se encuentran en el mismo plano, lo que nos permite dibujar imágenes de ellos. La situación se puede representar así, donde designa el origen:xeY=βx+ebβr=Y−bxO
Esta imagen fue construido comenzando con , a continuación, añadiendo el error para producir . La altitud se redujo a la base, encontrándola en la estimación de mínimos cuadrados . Claramente, la altitud es el vector residual y, por lo tanto, se ha etiquetado como .βxeYbxY−bxr
La base del triángulo es paralela al vector regresor . Las altitudes de los lados y son la altitud del triángulo mismo. Por definición, el residual es perpendicular a la base: por lo tanto, las distancias lejos de la base se pueden encontrar por proyección sobre . Por lo tanto, la altitud del triángulo se puede encontrar en cualquiera de las tres formas: regresando contra (encontrando la altura de ); retroceder contra (encontrar la altura de ), o retroceder contra (encontrar la altura dexOY(βx)YrrYrYererrr ) Los tres valores deben ser todos iguales (como puede verificar ejecutando estas regresiones). El último obviamente es , QED .1
Para aquellos que prefieren el álgebra, podemos convertir este análisis geométrico en una elegante demostración algebraica. Simplemente observe que , , e son todos módulos congruentes del subespacio generado por . Por lo tanto, deben tener proyecciones iguales en cualquier espacio ortogonal a , como el generado por , donde la proyección de tiene el coeficiente , QED . (Estadísticamente, simplemente "sacamos" el componente de en las tres expresiones, dejando en cada caso).e = r + ( β - b ) x Y = e + β x = r + ( 2 β - b ) x x x r r 1 x rre=r+(β−b)xY=e+βx=r+(2β−b)xxxrr1xr
lm(y~r)
,lm(e~r)
ylm(r~r)
, que por lo tanto deben ser todos iguales. Este último obviamente es . Pruebe estos tres comandos para ver. Para que el último funcione , debe crear una copia de , como . Para obtener más información sobre los diagramas geométricos de regresión, consulte stats.stackexchange.com/a/113207 .R
r
s<-r;lm(r~s)