En el primer nivel, creo que todos ustedes ignoran la contracción hacia los valores de la población; " las pendientes e intersecciones por sujeto del modelo de efectos mixtos están más cerca de las estimaciones de población que las estimaciones de mínimos cuadrados dentro del sujeto " . [ref. 1] El siguiente enlace probablemente también sea de ayuda ( ¿Cuáles son los descriptivos adecuados para mis modelos mixtos? ), Vea la respuesta de Mike Lawrence).
Además, creo que eres un poco desafortunado en tu ejemplo de juguete porque tienes un diseño perfectamente equilibrado que hace que tengas exactamente la misma estimación en el caso de que no falten valores.
Pruebe el siguiente código que tiene el mismo proceso sin ningún valor perdido ahora:
cat <- as.factor(sample(1:5, n*k, replace=T) ) #This should be a bit unbalanced.
cat_i <- 1:k # intercept per kategorie
x <- rep(1:n, k)
sigma <- 0.2
alpha <- 0.001
y <- cat_i[cat] + alpha * x + rnorm(n*k, 0, sigma)
m1 <- lm(y ~ x)
m3 <- lme(y ~ x, random = ~ 1|cat, na.action = na.omit)
round(digits= 7,fixef(m3)) == round(digits=7, coef(m1)) #Not this time lad.
#(Intercept) x
# FALSE FALSE
Donde ahora, debido a que su diseño no está perfectamente equilibrado, no tiene las mismas estimaciones de coeficientes.
En realidad, si juegas junto con tu patrón de valor perdido de una manera tonta (por ejemplo:) y[ c(1:10, 100 + 1:10, 200 + 1:10, 300 + 1:10, 400 +1:10)] <- NA
para que tu diseño aún esté perfectamente equilibrado, obtendrás los mismos coeficientes nuevamente.
require(nlme)
set.seed(128)
n <- 100
k <- 5
cat <- as.factor(rep(1:k, each = n))
cat_i <- 1:k # intercept per kategorie
x <- rep(1:n, k)
sigma <- 0.2
alpha <- 0.001
y <- cat_i[cat] + alpha * x + rnorm(n*k, 0, sigma)
plot(x, y)
# simulate missing data in a perfectly balanced way
y[ c(1:10, 100 + 1:10, 200 + 1:10, 300 + 1:10, 400 +1:10)] <- NA
m1 <- lm(y ~ x)
m3 <- lme(y ~ x, random = ~ 1|cat, na.action = na.omit)
round(digits=7,fixef(m3)) == round(digits=7, coef(m1)) #Look what happend now...
#(Intercept) x
# TRUE TRUE
Usted está marginalmente equivocado por el diseño perfecto de su experimento original. Cuando insertó los NA en una distancia no equilibrada, cambió el patrón de cuánta "fuerza" podían prestarse los sujetos individuales entre sí.
En resumen, las diferencias que ve se deben a los efectos de contracción y más específicamente porque distorsionó su diseño perfectamente equilibrado original con valores perdidos no perfectamente equilibrados.
Ref. 1: Douglas Bates lme4: Modelado de efectos mixtos con R , páginas 71-72
m3
es 0.0011713" en lugar dem2
.