Sabemos que una prueba t emparejada es solo un caso especial de ANOVA de medidas repetidas unidireccionales (o dentro del sujeto), así como el modelo lineal de efectos mixtos, que se puede demostrar con la función lme () del paquete nlme en R Como se muestra abajo.
#response data from 10 subjects under two conditions
x1<-rnorm(10)
x2<-1+rnorm(10)
# Now create a dataframe for lme
myDat <- data.frame(c(x1,x2), c(rep("x1", 10), rep("x2", 10)), rep(paste("S", seq(1,10), sep=""), 2))
names(myDat) <- c("y", "x", "subj")
Cuando ejecuto la siguiente prueba t emparejada:
t.test(x1, x2, paired = TRUE)
Obtuve este resultado (obtendrá un resultado diferente debido al generador aleatorio):
t = -2.3056, df = 9, p-value = 0.04657
Con el enfoque ANOVA podemos obtener el mismo resultado:
summary(aov(y ~ x + Error(subj/x), myDat))
# the F-value below is just the square of the t-value from paired t-test:
Df F value Pr(>F)
x 1 5.3158 0.04657
Ahora puedo obtener el mismo resultado en lme con el siguiente modelo, suponiendo una matriz de correlación simétrica definida positiva para las dos condiciones:
summary(fm1 <- lme(y ~ x, random=list(subj=pdSymm(form=~x-1)), data=myDat))
# the 2nd row in the following agrees with the paired t-test
# (Intercept) -0.2488202 0.3142115 9 -0.7918878 0.4488
# xx2 1.3325786 0.5779727 9 2.3056084 0.0466
U otro modelo, suponiendo una simetría compuesta para la matriz de correlación de las dos condiciones:
summary(fm2 <- lme(y ~ x, random=list(subj=pdCompSymm(form=~x-1)), data=myDat))
# the 2nd row in the following agrees with the paired t-test
# (Intercept) -0.2488202 0.4023431 9 -0.618428 0.5516
# xx2 1.3325786 0.5779727 9 2.305608 0.0466
Con la prueba t pareada y el ANOVA de medidas repetidas unidireccionales, puedo escribir el modelo de media celular tradicional como
Yij = μ + αi + βj + εij, i = 1, 2; j = 1, ..., 10
donde i indexa la condición, j indexa el sujeto, Y ij es la variable de respuesta, μ es constante para el efecto fijo para la media general, α i es el efecto fijo para la condición, β j es el efecto aleatorio para el sujeto después de N (0, σ p 2 ) (σ p 2 es la varianza de la población), y ε ij es residual después de N (0, σ 2 ) (σ 2 es la varianza dentro del sujeto).
Pensé que el modelo de media de celda anterior no sería apropiado para los modelos lme, pero el problema es que no puedo encontrar un modelo razonable para los dos enfoques lme () con el supuesto de estructura de correlación. La razón es que el modelo lme parece tener más parámetros para los componentes aleatorios que los que ofrece el modelo de media celular anterior. Al menos el modelo lme proporciona exactamente el mismo valor F, grados de libertad y valor p también, que gls no puede. Más específicamente, gls da DF incorrectos debido al hecho de que no tiene en cuenta el hecho de que cada sujeto tiene dos observaciones, lo que lleva a DF muy inflados. Lo más probable es que el modelo lme esté sobre-parametrizado al especificar los efectos aleatorios, pero no sé cuál es el modelo y cuáles son los parámetros. Entonces el problema aún no está resuelto para mí.