Desde
sabemos que
y así sabemos que para cada componente de ,
donde es el elemento diagonal de . Por lo tanto, sabemos que
β^=(XTX)−1XTY=(XTX)−1XT(Xβ+ε)=β+(XTX)−1XTε
β^−β∼N(0,σ2(XTX)−1)
kβ^β^k−βk∼N(0,σ2Skk)
Skkkth(XTX)−1zk=β^k−βkσ2Skk−−−−−√∼N(0,1).
Tome nota de la declaración del Teorema para la distribución de una forma cuadrática idempotente en un vector normal estándar (Teorema B.8 en Greene):
Si y es simétrica y idempotente, entonces se distribuye donde es el rango de .x∼N(0,I)AxTAxχ2ννA
Deje que denote el vector residual de regresión y deje que
que es la matriz del fabricante residual (es decir, ) . Es fácil verificar que es simétrica e idempotente .ε^
M=In−X(XTX)−1XT,
My=ε^M
Sea
un estimador de .
s2=ε^Tε^n−p
σ2
Entonces necesitamos hacer algo de álgebra lineal. Tenga en cuenta estas tres propiedades de álgebra lineal:
- El rango de una matriz idempotente es su rastro.
- Tr(A1+A2)=Tr(A1)+Tr(A2)
- Tr(A1A2)=Tr(A2A1) si se y es ( esta propiedad es fundamental para la continuación del trabajo )A1n1×n2A2n2×n1
Entonces
rank(M)=Tr(M)=Tr(In−X(XTX)−1XT)=Tr(In)−Tr(X(XTX)−1XT))=Tr(In)−Tr((XTX)−1XTX))=Tr(In)−Tr(Ip)=n−p
Entonces
V=(n−p)s2σ2=ε^Tε^σ2=(εσ)TM(εσ).
Aplicando el teorema para la distribución de una forma cuadrática idempotente en un vector normal estándar (mencionado anteriormente), sabemos que .V∼χ2n−p
Como supuso que se distribuye normalmente, entonces es independiente de , y dado que es una función de , entonces también es independiente de . Por lo tanto, y son independientes entre sí.εβ^ε^s2ε^s2β^zkV
Entonces,
es la relación de una distribución Normal estándar con la raíz cuadrada de una distribución Chi-cuadrado con los mismos grados de libertad (es decir, ), que es una caracterización de la distribución . Por lo tanto, la estadística tiene una distribución con grados de libertad.
tk=zkV/(n−p)−−−−−−−−√
n−pttktn−p
Entonces puede ser manipulado algebraicamente en una forma más familiar.
tk=β^k−βkσ2Skk√(n−p)s2σ2/(n−p)−−−−−−−−−−−−√=β^k−βkSkk√s2−−√=β^k−βks2Skk−−−−−√=β^k−βkse(β^k)