He estado buscando modelos de efectos mixtos usando el paquete lme4 en R. Estoy usando principalmente el lmer
comando, así que haré mi pregunta a través del código que usa esa sintaxis. Supongo que una pregunta fácil en general podría ser: ¿está bien comparar dos modelos construidos lmer
utilizando razones de probabilidad basadas en conjuntos de datos idénticos? Creo que la respuesta a eso debe ser "no", pero podría ser incorrecta. He leído información contradictoria sobre si los efectos aleatorios tienen que ser iguales o no, y ¿qué componente de los efectos aleatorios se entiende por eso? Entonces, presentaré algunos ejemplos. Los tomaré de datos de medidas repetidas usando estímulos de palabras, tal vez algo como Baayen (2008) sería útil para interpretar.
Digamos que tengo un modelo donde hay dos predictores de efectos fijos, los llamaremos A y B, y algunos efectos aleatorios ... palabras y temas que los percibieron. Podría construir un modelo como el siguiente.
m <- lmer( y ~ A + B + (1|words) + (1|subjects) )
(tenga en cuenta que he dejado de lado intencionalmente data =
y asumiremos que siempre me refiero REML = FALSE
a la claridad)
Ahora, de los siguientes modelos, ¿cuáles están bien para comparar con una razón de probabilidad con respecto al anterior y cuáles no?
m1 <- lmer( y ~ A + B + (A+B|words) + (1|subjects) )
m2 <- lmer( y ~ A + B + (1|subjects) )
m3 <- lmer( y ~ A + B + (C|words) + (A+B|subjects) )
m4 <- lmer( y ~ A + B + (1|words) )
m5 <- lmer( y ~ A * B + (1|subjects) )
Reconozco que la interpretación de algunas de estas diferencias puede ser difícil o imposible. Pero dejemos eso a un lado por un segundo. Solo quiero saber si hay algo fundamental en los cambios aquí que impide la posibilidad de comparar. También quiero saber si, si los LR están bien, y las comparaciones de AIC también.