Suponga que todas las variables están estandarizadas por la transformación de correlación, como usted mencionó, la versión escalada de longitud de unidad de . El modelo estandarizado no cambia la correlación entre las variables se puede calcular cuando se realiza la transformación estandarizada del modelo lineal original. Denotemos la matriz de diseño después de la transformación estandarizada como
Entonces
XXXVIFX∗=⎡⎣⎢⎢⎢⎢⎢11⋮1X11X21⋮Xn1……⋮…X1,p−1X2,p−1⋮Xn,p−1⎤⎦⎥⎥⎥⎥⎥.
X∗′X∗=[n00′rXX],
donde es la matriz de correlación de variables. También sabemos que
para es el término diagonal -ésimo de .rXXXσ2{β^}=σ2(X∗′X∗)−1=σ2[1n00′r−1XX.]
VIFkk=1,2,…,p−1kr−1XXk=1rXXk . Definamos:
Tenga en cuenta que ambas matrices son diferentes de las matrices de diseño. Como solo nos preocupamos por los coeficientes de las variables , el vector de una matriz de diseño puede ignorarse en nuestro cálculo. Por lo tanto, al usar el complemento de Schur ,
X(−1)=⎡⎣⎢⎢⎢⎢⎢X12X22⋮Xn2……⋮…X1,p−1X2,p−1⋮Xn,p−1⎤⎦⎥⎥⎥⎥⎥,X1=⎡⎣⎢⎢⎢⎢X11X21⋮Xn1⎤⎦⎥⎥⎥⎥.
X1r−1XX(1,1)=(r11−r1X(−1)r−1X(−1)X(−1)rX(−1)1)−1=(r11−[r1X(−1)r−1X(−1)X(−1)]rX(−1)X(−1)[r−1X(−1)X(−1)rX(−1)1])−1=(1−β′1X(−1)X′(−1)X(−1)β1X(−1))−1,
donde son los coeficientes de regresión de en excepto la intersección. De hecho, la intercepción debe ser el origen, ya que todas lasβ1X(−1)X1X2,…,Xp−1XLas variables están estandarizadas con media cero. Por otro lado, (sería más sencillo si pudiéramos escribir todo en forma de matriz explícita)
Por lo tanto
R21=SSRSSTO=β′1X(−1)X′(−1)X(−1)β1X(−1)1=β′1X(−1)X′(−1)X(−1)β1X(−1).
VIF1=r−1XX(1,1)=11−R21.