La ocurrencia no tan infrecuente cuando se trata de modelos mixtos máximos complejos (estimar todos los efectos aleatorios posibles para datos y modelo dados) es perfecta (+1 o -1) o una correlación casi perfecta entre algunos efectos aleatorios. Para el propósito de la discusión, observemos el siguiente modelo y resumen del modelo
Model: Y ~ X*Cond + (X*Cond|subj)
# Y = logit variable
# X = continuous variable
# Condition = values A and B, dummy coded; the design is repeated
# so all participants go through both Conditions
# subject = random effects for different subjects
Random effects:
Groups Name Variance Std.Dev. Corr
subject (Intercept) 0.85052 0.9222
X 0.08427 0.2903 -1.00
CondB 0.54367 0.7373 -0.37 0.37
X:CondB 0.14812 0.3849 0.26 -0.26 -0.56
Number of obs: 39401, groups: subject, 219
Fixed effects:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 2.49686 0.06909 36.14 < 2e-16 ***
X -1.03854 0.03812 -27.24 < 2e-16 ***
CondB -0.19707 0.06382 -3.09 0.00202 **
X:CondB 0.22809 0.05356 4.26 2.06e-05 ***
La supuesta razón detrás de estas correlaciones perfectas es que hemos creado un modelo que es demasiado complejo para los datos que tenemos. El consejo común que se da en estas situaciones es (por ejemplo, Matuschek et al., 2017; papel ) para fijar los coeficientes sobreparamizados a 0, porque estos modelos degenerados tienden a disminuir la potencia. Si observamos un cambio marcado en los efectos fijos en un modelo reducido, deberíamos aceptarlo; Si no hay cambio, entonces no hay problema en aceptar el original.
Sin embargo, supongamos que no estamos interesados solo en los efectos fijos controlados por RE (efectos aleatorios), sino también en la estructura de RE. En el caso dado, sería teóricamente correcto asumir que Intercept
y la pendiente X
tiene una correlación negativa distinta de cero. Siguen varias preguntas:
¿Qué hacer en tales situaciones? ¿Deberíamos informar la correlación perfecta y decir que nuestros datos no son "suficientemente buenos" para estimar la correlación "real"? ¿O deberíamos informar el modelo de correlación 0? ¿O deberíamos intentar establecer alguna otra correlación a 0 con la esperanza de que la "importante" ya no sea perfecta? No creo que haya respuestas 100% correctas aquí, me gustaría escuchar sus opiniones.
¿Cómo escribir el código que fija la correlación de 2 efectos aleatorios específicos a 0, sin influir en las correlaciones entre otros parámetros?
blme
, MCMCglmm
, rstanarm
, brms
...)