¿Cómo puedo evaluar el ajuste del modelo logístico / GEE cuando las covariables tienen algunos datos faltantes?


9

He ajustado dos modelos de ecuación de estimación generalizada (GEE) a mis datos:

1) Modelo 1: El resultado es longitudinal Sí / No variable (A) (año 1,2,3,4,5) con predictor continuo longitudinal (B) para los años 1,2,3,4,5.

2) Modelo 2: El resultado es la misma variable longitudinal Sí / No (A), pero ahora con mi predictor fijado en su valor del año 1, es decir, obligado a ser invariante en el tiempo (B).

Debido a que faltan mediciones en mi predictor longitudinal en algunos puntos de tiempo para diferentes casos, el número de puntos de datos en el modelo 2 es mayor que en el modelo 1.

Me gustaría saber qué comparaciones puedo hacer válidamente entre las razones de posibilidades, los valores p y el ajuste de los dos modelos, por ejemplo:

  • Si el OR para el predictor B es mayor en el modelo 1, ¿puedo decir válidamente que la asociación entre A y B es más fuerte en el modelo1?

  • ¿Cómo puedo evaluar cuál es el mejor modelo para mis datos? ¿estoy en lo cierto al pensar que los pseudo R al cuadrado de QIC / AIC no deberían compararse entre modelos si el número de observaciones no es el mismo?

Cualquier ayuda sería muy apreciada.


Debido a que el Modelo 2 no se considera realmente "anidado" del Modelo 1, no sé cuán válido sería usar QIC para evaluar el ajuste comparativo. Uno pensaba que tenía que usar técnicas de imputación múltiple para igualar el número de observaciones, y luego uno podría comparar los valores de QIC para esos modelos. Sin embargo, cierta literatura, por ejemplo, "Análisis de datos longitudinales aplicados para epidemiología" por Twisk, mostró resultados realmente inconsistentes al usar técnicas de IM en modelos que tienen variables de respuesta dicotómicas. Desearía poder ayudar más.
Iris Tsui

1
¿Por qué faltan los valores? ¿Es su falta sistemática de forma tal que los valores perdidos son fundamentalmente diferentes de los valores no perdidos?
Macro

Respuestas:


1

Definitivamente, probaría la imputación múltiple (por ejemplo, con ratones o Amelia en R), posiblemente con varios métodos alternativos para imputar valores perdidos.

En el peor de los casos, puede considerarlo un análisis de sensibilidad.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.