Si está haciendo ANOVA unidireccional para probar si hay una diferencia significativa entre los grupos, entonces está comparando implícitamente dos modelos anidados (por lo tanto, solo hay un nivel de anidación, pero todavía está anidando).
Esos dos modelos son:
- Modelo 0: Los valores (con el número de muestra el número de grupo) se modelan por la media estimada, de toda la muestra.
yijijβ^0
yij=β^0+ϵi
Modelo 1: los valores se modelan por los medios estimados de los grupos.
(y si representamos el modelo por las variaciones entre grupos,
, entonces el modelo 0 está anidado dentro del modelo 1)βj^
yi=β^0+β^j+ϵi
Un ejemplo de comparación de medias y equivalencia con modelos anidados: tomemos la longitud del sepal (cm) del conjunto de datos del iris (si usamos las cuatro variables, podríamos estar haciendo LDA o MANOVA como lo hizo Fisher en 1936)
Las medias totales y grupales observadas son:
μtotalμsetosaμversicolorμvirginica=5.83=5.01=5.94=6.59
Que está en forma de modelo:
model 1: model 2: yij=5.83+ϵiyij=5.01+⎡⎣⎢00.931.58⎤⎦⎥j+ϵi
El en el modelo 1 representa la suma total de cuadrados .∑ϵ2i=102.1683
El en el modelo 2 representa la suma dentro del grupo de los cuadrados .∑ϵ2i=38.9562
Y la tabla ANOVA será como (y calculará implícitamente la diferencia que es la suma de cuadrados entre grupos que es el 63.212 en la tabla con 2 grados de libertad):
> model1 <- lm(Sepal.Length ~ 1 + Species, data=iris)
> model0 <- lm(Sepal.Length ~ 1, data=iris)
> anova(model0, model1)
Analysis of Variance Table
Model 1: Sepal.Length ~ 1
Model 2: Sepal.Length ~ 1 + Species
Res.Df RSS Df Sum of Sq F Pr(>F)
1 149 102.168
2 147 38.956 2 63.212 119.26 < 2.2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
con
F=RSSdifferenceDFdifferenceRSSnewDFnew=63.212238.956147=119.26
conjunto de datos utilizado en el ejemplo:
longitud del pétalo (cm) para tres especies diferentes de flores de iris
Iris setosa Iris versicolor Iris virginica
5.1 7.0 6.3
4.9 6.4 5.8
4.7 6.9 7.1
4.6 5.5 6.3
5.0 6.5 6.5
5.4 5.7 7.6
4.6 6.3 4.9
5.0 4.9 7.3
4.4 6.6 6.7
4.9 5.2 7.2
5.4 5.0 6.5
4.8 5.9 6.4
4.8 6.0 6.8
4.3 6.1 5.7
5.8 5.6 5.8
5.7 6.7 6.4
5.4 5.6 6.5
5.1 5.8 7.7
5.7 6.2 7.7
5.1 5.6 6.0
5.4 5.9 6.9
5.1 6.1 5.6
4.6 6.3 7.7
5.1 6.1 6.3
4.8 6.4 6.7
5.0 6.6 7.2
5.0 6.8 6.2
5.2 6.7 6.1
5.2 6.0 6.4
4.7 5.7 7.2
4.8 5.5 7.4
5.4 5.5 7.9
5.2 5.8 6.4
5.5 6.0 6.3
4.9 5.4 6.1
5.0 6.0 7.7
5.5 6.7 6.3
4.9 6.3 6.4
4.4 5.6 6.0
5.1 5.5 6.9
5.0 5.5 6.7
4.5 6.1 6.9
4.4 5.8 5.8
5.0 5.0 6.8
5.1 5.6 6.7
4.8 5.7 6.7
5.1 5.7 6.3
4.6 6.2 6.5
5.3 5.1 6.2
5.0 5.7 5.9
anova()
función, porque el primer ANOVA real también está usando una prueba F. Esto lleva a confusión terminológica.