Resumen Ejecutivo
De hecho, a menudo se dice que si todos los niveles de factores posibles se incluyen en un modelo mixto, entonces este factor debe tratarse como un efecto fijo. Esto no es necesariamente cierto PARA DOS RAZONES DISTINTAS:
(1) Si el número de niveles es grande, entonces puede tener sentido tratar el factor [cruzado] como aleatorio.
Estoy de acuerdo con @Tim y @RobertLong aquí: si un factor tiene una gran cantidad de niveles que están incluidos en el modelo (como, por ejemplo, todos los países del mundo; o todas las escuelas de un país; o tal vez toda la población de los sujetos son encuestados, etc.), entonces no hay nada de malo en tratarlo como aleatorio --- esto podría ser más parsimonioso, podría proporcionar cierta contracción, etc.
lmer(size ~ age + subjectID) # fixed effect
lmer(size ~ age + (1|subjectID)) # random effect
(2) Si el factor está anidado dentro de otro efecto aleatorio, entonces debe tratarse como aleatorio, independientemente de su número de niveles.
Hubo una gran confusión en este hilo (ver comentarios) porque otras respuestas son sobre el caso # 1 anterior, pero el ejemplo que dio es un ejemplo de una situación diferente , a saber, este caso # 2. Aquí solo hay dos niveles (es decir, ¡"un gran número"!) Y agotan todas las posibilidades, pero están anidados dentro de otro efecto aleatorio , produciendo un efecto aleatorio anidado.
lmer(size ~ age + (1|subject) + (1|subject:side) # side HAS to be random
Discusión detallada de su ejemplo.
Los lados y las materias en su experimento imaginario están relacionados, como las clases y las escuelas, en el ejemplo del modelo jerárquico estándar. Quizás cada escuela (# 1, # 2, # 3, etc.) tiene clase A y clase B, y se supone que estas dos clases son aproximadamente las mismas. No modelará las clases A y B como un efecto fijo con dos niveles; Esto sería un error. Pero tampoco modelará las clases A y B como un efecto aleatorio "separado" (es decir, cruzado) con dos niveles; Esto también sería un error. En cambio, modelarás las clases como un efecto aleatorio anidado dentro de las escuelas.
Vea aquí: Efectos aleatorios cruzados versus anidados: ¿en qué se diferencian y cómo se especifican correctamente en lme4?
En su estudio imaginario del tamaño del pie, sujeto y lado son efectos aleatorios y el lado está anidado dentro del sujeto. Esto significa esencialmente que se forma una variable combinada, por ejemplo, John-Left, John-Right, Mary-Left, Mary-Right, etc., y hay dos efectos aleatorios cruzados: sujetos y sujetos-lados. Entonces para el sujeto i = 1 ... nj = 1 , 2
Tallai j k= μ + α ⋅ Alturai j k+ β⋅ pesoi j k+ γ⋅ edadi j k+ ϵyo+ ϵyo j+ϵi j k
ϵyo∼ N( 0 , σ2s u b j e c t s) ,Intercepción aleatoria para cada sujeto.
ϵyo j∼ N( 0 , σ2lado del sujeto) ,Al azar int. para el lado anidado en el sujeto
ϵi j k∼ N( 0 , σ2ruido) ,Término de error
Como escribió usted mismo, "no hay razón para creer que los pies derechos serán, en promedio, más grandes que los izquierdos". Por lo tanto, no debe haber ningún efecto "global" (ni cruzado fijo ni aleatorio) del pie derecho o izquierdo; en cambio, se puede pensar que cada sujeto tiene "un" pie y "otro" pie, y esta variabilidad deberíamos incluirla en el modelo. Estos pies "uno" y "otro" están anidados dentro de los sujetos, por lo tanto, tienen efectos aleatorios anidados.
Más detalles en respuesta a los comentarios. [26 de septiembre]
Mi modelo anterior incluye Side como un efecto aleatorio anidado dentro de los Sujetos. Aquí hay un modelo alternativo, sugerido por @Robert, donde Side es un efecto fijo:
Tallai j k= μ + α ⋅ Alturai j k+ β⋅ pesoi j k+ γ⋅ edadi j k+ δ⋅ ladoj+ ϵyo+ ϵi j k
yo j
No puede.
Lo mismo es cierto para el modelo hipotético de @gung con Side como un efecto aleatorio cruzado:
Tallai j k= μ + α ⋅ Alturai j k+ β⋅ pesoi j k+ γ⋅ edadi j k+ ϵyo+ ϵj+ ϵi j k
Tampoco tiene en cuenta las dependencias.
Demostración a través de una simulación [2 de octubre]
Aquí hay una demostración directa en R.
Genero un conjunto de datos de juguetes con cinco sujetos medidos en ambos pies durante cinco años consecutivos. El efecto de la edad es lineal. Cada sujeto tiene una intercepción aleatoria. Y cada sujeto tiene uno de los pies (ya sea el izquierdo o el derecho) más grande que otro.
set.seed(17)
demo = data.frame(expand.grid(age = 1:5,
side=c("Left", "Right"),
subject=c("Subject A", "Subject B", "Subject C", "Subject D", "Subject E")))
demo$size = 10 + demo$age + rnorm(nrow(demo))/3
for (s in unique(demo$subject)){
# adding a random intercept for each subject
demo[demo$subject==s,]$size = demo[demo$subject==s,]$size + rnorm(1)*10
# making the two feet of each subject different
for (l in unique(demo$side)){
demo[demo$subject==s & demo$side==l,]$size = demo[demo$subject==s & demo$side==l,]$size + rnorm(1)*7
}
}
plot(1:50, demo$size)
Disculpas por mis terribles habilidades de R. Así es como se ven los datos (cada cinco puntos consecutivos son un pie de una persona medida a lo largo de los años; cada diez puntos consecutivos son dos pies de la misma persona):
Ahora podemos adaptarnos a un montón de modelos:
require(lme4)
summary(lmer(size ~ age + side + (1|subject), demo))
summary(lmer(size ~ age + (1|side) + (1|subject), demo))
summary(lmer(size ~ age + (1|subject/side), demo))
Todos los modelos incluyen un efecto fijo age
y un efecto aleatorio de subject
, pero se tratan de manera side
diferente.
side
age
t = 1.8
side
age
t = 1.4 ), la varianza residual es enorme (29.81).
side
age
t = 37 , sí, treinta y siete), la varianza residual es pequeña (0.07).
Esto muestra claramente que side
debe tratarse como un efecto aleatorio anidado.
Finalmente, en los comentarios @Robert sugirió incluir el efecto global de side
como variable de control. Podemos hacerlo, manteniendo el efecto aleatorio anidado:
summary(lmer(size ~ age + side + (1|subject/side), demo))
summary(lmer(size ~ age + (1|side) + (1|subject/side), demo))
side
t = 0.5side