Dado que la afirmación en la cita es una colección de declaraciones sobre el cambio de escala de las columnas de , también podría probarlas todas a la vez. De hecho, no se necesita más trabajo para probar una generalización de la afirmación:X
Cuando se multiplica a la derecha por una matriz invertible , entonces el nuevo coeficiente estimado es igual a multiplicado a izquierda por .A β A β A - 1XAβ^Aβ^A−1
Los únicos hechos algebraicos que necesita son los (fácilmente comprobados y conocidos) que para cualquier matriz y para las matrices invertibles y . (Se necesita una versión más sutil de este último cuando se trabaja con inversas generalizadas: para y invertibles y cualquier , . )(AB)′=B′A′AB(AB)−1=B−1A−1ABABX(AXB)−=B−1X−A−1
Prueba por álgebra :
β^A=((XA)′((XA))−(XA)′y=A−1(X′X)−(A′)−1A′y=A−1β^,
QED (Para que esta prueba sea completamente general, el superíndice refiere a un inverso generalizado).−
Prueba por geometría :
Dadas las bases y de y , respectivamente, representa una transformación lineal de a . puede considerar que la multiplicación a la derecha de por deja esta transformación fija pero cambia a (es decir, a las columnas de ). Bajo ese cambio de base, la representación de cualquier vector debe cambiar mediante la multiplicación a la izquierda por ,EpEnRnRpXRpRnXAEpAEpAβ^∈RpA−1QED .
(Esta prueba funciona, sin modificaciones, incluso cuando no es invertible).X′X
La cita se refiere específicamente al caso de las matrices diagonales con para y .AAii=1i≠jAjj=c
Conexión con mínimos cuadrados
El objetivo aquí es utilizar los primeros principios para obtener el resultado, siendo el principio el de los mínimos cuadrados: estimar los coeficientes que minimizan la suma de los cuadrados de los residuos.
Nuevamente, probar una generalización (enorme) no es más difícil y es más bien revelador. Suponga que es cualquier mapa (lineal o no) de espacios vectoriales reales y suponga que es cualquier función de valor real en . Deje que sea el conjunto (posiblemente vacío) de puntos para los que está minimizado. Q W n U ⊂ V p v Q ( ϕ ( v ) )
ϕ:Vp→Wn
QWnU⊂VpvQ(ϕ(v))
Resultado: , que está determinado únicamente por y , no depende de ninguna elección de base utilizada para representar vectores en .Q ϕ E p V pUQϕEpVp
Prueba: QED.
¡No hay nada que demostrar!
Aplicación del resultado: Sea una forma cuadrática semidefinida positiva en , deje , y suponga que es un mapa lineal representado por cuando las bases de y son elegidos. Defina . Elija una base de y suponga que es la representación de algunos en esa base. Esto es mínimos cuadrados : minimiza la distancia al cuadrado . PorqueR n y ∈ R n φ X V p = R p W n = R n Q ( x ) = F ( y , x ) R p β v ∈ U x = X β F ( y , x ) X R p X A β A - 1FRny∈RnϕXVp=RpWn=RnQ(x)=F(y,x)Rpβ^v∈Ux=Xβ^F(y,x)Xes un mapa lineal, el cambio de la base de corresponde a-multiplicando derecho por alguna matriz invertible . Eso multiplicará a la izquierda por , QED .RpXAβ^A−1