Soy un epidemiólogo que intenta comprender los GEE para analizar adecuadamente un estudio de cohorte (usando la regresión de Poisson con un enlace de registro, para estimar el riesgo relativo). Tengo algunas preguntas sobre la "correlación de trabajo" que me gustaría que alguien más conocedor aclare:
(1) Si tengo mediciones repetidas en el mismo individuo, ¿es generalmente más razonable asumir una estructura intercambiable? (¿O un autorregresivo si las mediciones muestran una tendencia)? ¿Qué pasa con la independencia? ¿Hay casos en los que uno podría asumir independencia para las mediciones en el mismo individuo?
(2) ¿Hay alguna forma (razonablemente simple) de evaluar la estructura adecuada mediante el examen de los datos?
(3) Noté que, al elegir una estructura de independencia, obtengo las mismas estimaciones puntuales (pero errores estándar más bajos) que cuando ejecuto una regresión de Poisson simple (usando R, función glm()
y geeglm()
del paquete geepack
). ¿Por qué está pasando esto? Entiendo que con GEE usted estima un modelo promediado por la población (en contraste con el tema específico), por lo que debe obtener las mismas estimaciones puntuales solo en el caso de regresión lineal.
(4) Si mi cohorte está en varios sitios de ubicación (pero una medición por persona), ¿debería elegir una independencia o una correlación de trabajo intercambiable, y por qué? Quiero decir, las personas en cada sitio aún son independientes entre sí, ¿verdad? Por lo tanto, para un modelo específico de sujeto, por ejemplo, yo especificaría el sitio como un efecto aleatorio. Sin embargo, con GEE, la independencia y el intercambio dan estimaciones diferentes y no estoy seguro de cuál es mejor en términos de supuestos subyacentes.
(5) ¿Puede GEE manejar una agrupación jerárquica de 2 niveles, es decir, una cohorte multisitio con medidas repetidas por individuo? En caso afirmativo, ¿qué debo especificar como una variable de agrupación geeglm()
y cuál debería ser la correlación de trabajo si se supone, por ejemplo, "independencia" para el primer nivel (sitio) e "intercambiable" o "autorregresivo" para el segundo nivel (individual)?
Entiendo que estas son bastantes preguntas, y algunas de ellas pueden ser bastante básicas, pero aún así son muy difíciles para mí (¿y quizás para otros novatos?). Por lo tanto, cualquier ayuda es enorme y sinceramente apreciada, y para mostrar esto, he comenzado una recompensa.