Estoy examinando las tendencias (entre 1998 y 2011) en las tasas de mortalidad entre pacientes con enfermedad de Crohn. Cada paciente (caso) se incluyó entre 1998 y 2011. En el momento de la inclusión, cada paciente se comparó con un control saludable con la misma edad y sexo. Estoy analizando las tendencias en las tasas de mortalidad. Al hacer esto directamente, sin ningún ajuste, obtengo tasas de mortalidad fluctuantes a lo largo del tiempo, lo que probablemente se deba al hecho de que los individuos incluidos en un año dado no serán comparables a los incluidos en otro año. Por lo tanto, mi objetivo es ajustar las tasas de mortalidad. Espero que las tasas de mortalidad en ambos grupos (casos y controles) disminuyan con el tiempo y la brecha entre casos y controles se reduzca sucesivamente.
Mi idea es hacer el ajuste por medio de la regresión de Poisson. Mis datos están a nivel individual. Deseo obtener una estimación sobre la tasa de incidencia (por 1000 personas-año) para casos y controles cada año desde 1998 hasta 2011. El tiempo de supervivencia se incluiría como compensación en el modelo. Algo similar se ha hecho aquí .
He adjuntado las 200 primeras filas de mi conjunto de datos, que consta de 1500 personas. Aquí están los datos . Explicación variable:
- muerto = si el paciente falleció o no durante el seguimiento
- surv = tiempo de supervivencia en días
- grupo de edad = grupo de edad categorizado (4 grupos)
- género = masculino / femenino
- diagnóstico = 0 para control saludable, 1 para enfermedad de Crohn
- edad = edad en años
- inclusión_año = año de inclusión en el estudio
¿Qué probé hasta ahora? Intenté ajustar los modelos de Poisson con la función glm () en R, utilizando observaciones individuales (log (surv) como desplazamiento), pero recibí un error o no pude averiguar cómo usar los ajustes. También agregué los datos en grupos y luego analicé los recuentos de muertes en glm (); cuando utilicé el ajuste para obtener tasas de incidencia, solo pude obtener tasas para una edad / grupo de edad y sexo específicos (según sea necesario especificar en la función de predicción ()).
Realmente agradecería algunos consejos estadísticos y ejemplos de codificación, que se pueden hacer en el conjunto de datos adjunto.
contrasts<-
( *tmp*
, value = contr.funs [1 + isOF [nn]]): los contrastes se pueden aplicar solo a factores con 2 o más niveles
diagnosis*inclusion_year
términos de interacción. Si solo usa el modelo actual, el número de casos solo diferirá por la beta de diagnosis
, constante a lo largo de los años porque no está permitido interactuar. Luego, las predicciones serán solo una sustitución. No soy demasiado quisquilloso, así que solo subo la edad promedio y el porcentaje masculino promedio.