Use GEE cuando esté interesado en descubrir el efecto promedio poblacional de una covariable versus el efecto específico individual. Estas dos cosas solo son equivalentes en modelos lineales, pero no en no lineales (por ejemplo, logística). Para ver esto, tomemos, por ejemplo, el modelo logístico de efectos aleatorios de la observación 'del sujeto , ;jiYij
log(pij1−pij)=μ+ηi
donde es un efecto aleatorio para el sujeto y .ηi∼N(0,σ2)ipij=P(Yij=1|ηi)
Si usó un modelo de efectos aleatorios en estos datos, obtendría una estimación de que explica el hecho de que se aplicó una perturbación media distribuida normalmente cero a cada individuo, haciéndola específica individual.μ
Si utilizó GEE en estos datos, estimaría las probabilidades de registro promedio de la población. En este caso eso sería
ν=log⎛⎝⎜Eη(11+e−μ−ηi)1−Eη(11+e−μ−ηi)⎞⎠⎟
ν≠μ , en general. Por ejemplo, si y , entonces . Aunque los efectos aleatorios tienen media cero en la escala transformada (o vinculada ), su efecto no es media cero en la escala original de los datos. Intente simular algunos datos de un modelo de regresión logística de efectos mixtos y compare el promedio del nivel de población con el logit inverso de la intersección y verá que no son iguales, como en este ejemplo. Esta diferencia en la interpretación de los coeficientes es la diferencia fundamental entre GEE y los modelos de efectos aleatorios .μ=1σ2=1ν≈.83
Editar: en general, un modelo de efectos mixtos sin predictores se puede escribir como
ψ(E(Yij|ηi))=μ+ηi
donde es una función de enlace. Cuandoψ
ψ(Eη(ψ−1(E(Yij|ηi))))≠Eη(E(Yij|ηi))
habrá una diferencia entre los coeficientes promedio de la población (GEE) y los coeficientes específicos individuales (modelos de efectos aleatorios). Es decir, los promedios cambian transformando los datos, integrando los efectos aleatorios en la escala transformada y luego transformando de nuevo. Tenga en cuenta que en el modelo lineal, (es decir, ), la igualdad se mantiene, por lo que son equivalentes.ψ(x)=x
Edición 2: También vale la pena señalar que los errores estándar "robustos" de tipo sandwich producidos por un modelo GEE proporcionan intervalos de confianza asintóticos válidos (por ejemplo, en realidad cubren el 95% del tiempo) incluso si la estructura de correlación especificada en el modelo no es correcto.
Edición 3: si su interés es comprender la estructura de asociación en los datos, las estimaciones de asociaciones de GEE son notoriamente ineficientes (y a veces inconsistentes). He visto una referencia para esto, pero no puedo ubicarla ahora.