E[Y]=Xβ
(1,0,0)X(1,1,0)(1,0,1)
(1,1,12)=(1,1,1)(1,2,22)=(1,2,4)(1,3,32)=(1,3,9)
X1X2
V=⎛⎝⎜100112138⎞⎠⎟.
Entonces desde
⎛⎝⎜111010001⎞⎠⎟V=⎛⎝⎜111123149⎞⎠⎟,
resulta que
X1V=X2.
Los modelos en sí mismos, por lo tanto, están relacionados por
X1β1=E[Y]=X2β2=(X1V)β2=X1(Vβ2).
β2
β1=Vβ2.
Por lo tanto, la misma relación se mantiene para sus estimaciones de mínimos cuadrados. Esto muestra que los modelos tienen ajustes idénticos : simplemente los expresan de manera diferente.
Como las primeras columnas de las dos matrices modelo son iguales, cualquier tabla ANOVA que descomponga la varianza entre la primera columna y las columnas restantes no cambiará. Sin embargo, una tabla ANOVA que distinga entre la segunda y la tercera columna dependerá de cómo se codifiquen los datos.
R15X1X2
Para ilustrar, aquí hay datos como el suyo (pero con diferentes respuestas) y los análisis correspondientes generados en R
.
set.seed(17)
D <- data.frame(group=rep(1:3, each=5), y=rnorm(3*5, rep(1:3, each=5), sd=2))
Montar los dos modelos:
fit.1 <- lm(y ~ factor(group), D)
fit.2 <- lm(y ~ group + I(group^2), D)
Mostrar sus tablas ANOVA:
anova(fit.1)
anova(fit.2)
La salida para el primer modelo es
Df Sum Sq Mean Sq F value Pr(>F)
factor(group) 2 51.836 25.918 14.471 0.000634 ***
Residuals 12 21.492 1.791
Para el segundo modelo es
Df Sum Sq Mean Sq F value Pr(>F)
group 1 50.816 50.816 28.3726 0.0001803 ***
I(group^2) 1 1.020 1.020 0.5694 0.4650488
Residuals 12 21.492 1.791
Puedes ver que las sumas residuales de los cuadrados son iguales. Al agregar las dos primeras filas en el segundo modelo, obtendrá el mismo DF y la suma de los cuadrados, a partir de los cuales se puede calcular el mismo cuadrado medio, valor F y valor p.
Finalmente, comparemos las estimaciones de coeficientes.
beta.1.hat <- coef(fit.1)
beta.2.hat <- coef(fit.2)
La salida es
(Intercept) factor(group)2 factor(group)3
0.4508762 2.8073697 4.5084944
(Intercept) group I(group^2)
-3.4627385 4.4667371 -0.5531225
V
⎛⎝⎜100112138⎞⎠⎟⎛⎝⎜−3.46273854.4667371−0.5531225⎞⎠⎟=⎛⎝⎜0.45087622.80736974.5084944⎞⎠⎟.
Los ajustes realmente son los mismos tal como se afirma.