Análisis de supervivencia en R con datos truncados a la izquierda


8

Estoy haciendo un análisis de supervivencia en R con el survivalpaquete. Creo que estoy trabajando con datos truncados a la izquierda, pero no estoy completamente seguro de cómo manejarlos.

Tengo una cohorte de pacientes diagnosticados entre 1990 y 2012. Todos los pacientes tienen un tiempo de diagnóstico bien definido (tiempo de ingreso). Sin embargo, el resultado de interés (empeoramiento específico de la enfermedad) solo se ha documentado desde el año 2000 en adelante. Por lo tanto, para los pacientes diagnosticados antes de 2000, no se sabe si el resultado se produjo antes de ese momento, solo después.

Lo primero que pensé fue que necesitaba restringir el análisis al período de tiempo desde 2000, solo para incluir a los pacientes diagnosticados después de ese momento. Después de leer un poco, parece ser innecesario excluir a los pacientes diagnosticados antes del año 2000. Esto parece ser un truncamiento a la izquierda y puede tratarse con el coxphuso Surv(time1, time2, event), donde time1 es el tiempo de truncado a la izquierda (tiempo desde el diagnóstico hasta el inicio de la documentación de el resultado) y el tiempo 2 es el tiempo hasta el evento (desde el momento del diagnóstico).

Aquí hay dos ejemplos de pacientes en mi conjunto de datos:

Paciente n.º 1: diagnosticado en 1999. Resultado observado en 2001. Tiempo de truncamiento a la izquierda: 1 año (hasta 2000). Tiempo hasta el evento: 2 años.

Paciente n.º 2: diagnosticado en 2001. Resultado observado en 2005. Tiempo de truncamiento a la izquierda: 0 años. Tiempo hasta el evento: 4 años.

Para estos pacientes, supongo que sus tiempos de supervivencia (en años) en el objeto de supervivencia serían (respectivamente):

Surv(time1 = c(1,0), time2 = c(2,4), event = c(1,1))

¿Es este un ejemplo de datos truncados a la izquierda? Si es así, ¿es esta la forma correcta de manejarlo?

Respuestas:


3

Supongo que el tiempo desde el diagnóstico es su variable de tiempo subyacente. Por simplicidad, también asumo que el evento solo puede ocurrir una vez.

Puede tratar sus datos como censurados a la izquierda. Sin embargo, esto es diferente de ser truncado a la izquierda.

Para los datos truncados a la izquierda, solo incluimos en el estudio pacientes condicionados a que no hayan experimentado el evento en el momento de la inclusión. En su caso, esto equivaldría a tirar a la basura a los pacientes que tuvieron el evento antes de 2000. Por lo tanto, estamos modelando la supervivencia condicional a la supervivencia hasta la inclusión.

Esto es diferente de la censura a la izquierda. La censura a la izquierda ocurre cuando solo conocemos el límite superior del tiempo de un evento. Esto es exactamente lo que te sugieres, si te entiendo correctamente. En este caso, incluimos a todas las personas independientemente de sus tiempos de supervivencia, pero para algunas personas solo conocemos un límite superior de su tiempo de supervivencia.

Capítulo III de modelos estadísticos basados ​​en procesos de conteo por PK Andersen et al. proporciona una buena explicación de lo anterior junto con algunos ejemplos de ambos casos.


2

Es probable que se enfrente al sesgo del tiempo inmortal , lo que significa que la cohorte diagnosticada antes del 2000 es efectivamente inmortal, hasta después del 2000, cuando puede ocurrir el resultado. Según Rothman y Groenlandia, el enfoque correcto es, de hecho, excluir (truncar) del análisis los años anteriores a 2000 de observación, o bien sesgar el riesgo entre las estimaciones de cohortes hacia la hipótesis nula de que no hay diferencia en el peligro.

El survivalcomando Survno parece seguir la sintaxis que usa. ¿Qué pasa con la creación de una nueva variable donde el valor 0 corresponde al comienzo del tiempo (de estudio) (por ejemplo, año = 2000?), 1 corresponde a 1 unidad de tiempo, etc.?

Querrá leer sobre: ​​Rothman, KJ y Groenlandia, S. (1998). Epidemiología moderna , capítulo Estudios de cohortes: Tiempo de la persona inmortal. Lippincott-Raven, 2a edición.


Veo que el sesgo de tiempo inmortal es importante, por ejemplo, en ensayos con medicamentos en los que los pacientes que reciben el medicamento tienen la garantía de vivir un tiempo determinado por el diseño del estudio, mientras que el grupo de control no lo es, lo que resulta en un efecto positivo (falso) observado del medicamento. Sin embargo, en mi caso, la falta de datos de resultados es igual para todos los pacientes, independientemente de la exposición. Omitir a todos los pacientes diagnosticados antes de 2000, dará como resultado una grave falta de poder estadístico, ya que muchos de ellos experimentarán el resultado después de 2000. Creo que debe haber una forma de controlar el posible sesgo sin omitir a estos pacientes.
user3766836

Ah, ya veo, eso no estaba claro. Por otro lado: quizás sus datos simplemente no son compatibles con el análisis que desea realizar.
Alexis
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.