El modelo lineal general nos permite escribir un modelo ANOVA como modelo de regresión. Supongamos que tenemos dos grupos con dos observaciones cada uno, es decir, cuatro observaciones en un vector . Entonces, el modelo original sobreparamizado es , donde es la matriz de predictores, es decir, variables indicadoras codificadas de forma simulada:
E ( y ) = X ⋆ β ⋆ X ⋆ ( μ 1 μ 1 μ 2 μ 2 ) = ( 1 1 0 1 1 0 1 0 1 1 0 1 ) ( β ⋆ 0 β ⋆ 1 β ⋆ 2 )yE(y)=X⋆β⋆X⋆
⎛⎝⎜⎜⎜μ1μ1μ2μ2⎞⎠⎟⎟⎟=⎛⎝⎜⎜⎜111111000011⎞⎠⎟⎟⎟⎛⎝⎜β⋆0β⋆1β⋆2⎞⎠⎟
Los parámetros no son identificables como porque tiene rango 2 ( no es invertible). Para cambiar eso, presentamos la restricción (contrastes de tratamiento), que nos da el nuevo modelo :
X ⋆ ( X ⋆ ) ′ X ⋆ β ⋆ 1 = 0 E ( y ) = X β ( μ 1 μ 1 μ 2 μ 2 ) = ( 1 0 1 0 1 1 1 1((X⋆)′X⋆)−1(X⋆)′E(y)X⋆(X⋆)′X⋆β⋆1=0E(y)=Xβ
⎛⎝⎜⎜⎜μ1μ1μ2μ2⎞⎠⎟⎟⎟=⎛⎝⎜⎜⎜11110011⎞⎠⎟⎟⎟(β0β2)
Entonces, , es decir, adquiere el significado del valor esperado de nuestra categoría de referencia (grupo 1). , es decir, toma el significado de la diferencia a la categoría de referencia. Dado que con dos grupos, solo hay un parámetro asociado con el efecto de grupo, la hipótesis nula ANOVA (todos los parámetros de efecto de grupo son 0) es la misma que la hipótesis nula de peso de regresión (el parámetro de pendiente es 0).μ1=β0β0μ2=β0+β2β2μ2−μ1
Una prueba en el modelo lineal general prueba una combinación lineal de los parámetros contra un valor hipotético bajo la hipótesis nula. Al elegir , podemos probar la hipótesis de que (la prueba habitual para el parámetro de pendiente), es decir, aquí, . El estimador es , donde son Estimaciones de OLS para los parámetros. La estadística de prueba general para tales es:
tψ=∑cjβjψ0c=(0,1)′β2=0μ2−μ1=0ψ^=∑cjβ^jβ^=(X′X)−1X′yψ
t=ψ^−ψ0σ^c′(X′X)−1c−−−−−−−−−√
σ^2=∥e∥2/(n−Rank(X)) es un estimador imparcial de la varianza del error, donde es la suma de los residuos al cuadrado. En el caso de dos grupos , , y los estimadores son y . Con siendo 1 en nuestro caso, la estadística de prueba se convierte en:
R un n k ( X ) = 2 ( X ' X ) - 1 X ' = ( 0,5 0,5 0 0,5 - 0,5 0,5 0,5 ) β 0 = 0,5 y 1 + 0,5 y 2 = M 1 β 2 = - 0,5 y 1 - 0,5 y∥e∥2Rank(X)=2(X′X)−1X′=(.5−.5.5−.50.50.5)β^0=0.5y1+0.5y2=M1β^2=−0.5y1−0.5y2+0.5y3+0.5y4=M2−M1c′(X′X)−1c
t=M2−M1−0σ^=M2−M1∥e∥2/(n−2)−−−−−−−−−−√
t N - R un n k ( X ) n - 2 t ( M 2 - M 1 ) 2 / 1t está -distribuido con df (aquí ). Cuando cuadras , obtienes , el estadístico de prueba de la prueba ANOVA para dos grupos ( para entre, para dentro de los grupos) que sigue una - distribución con 1 df.tn−Rank(X)n−2tFbwFn-Rank(X)(M2−M1)2/1∥e∥2/(n−2)=SSb/dfbSSw/dfw=FFbwFn−Rank(X)
Con más de dos grupos, la hipótesis ANOVA (todos son simultáneamente 0, con ) se refiere a más de un parámetro y no puede expresarse como una combinación lineal , por lo que las pruebas no son equivalentes . 1 ≤ j ψβj1≤jψ