Análisis de supervivencia: tiempo continuo versus tiempo discreto


20

Estoy confundido acerca de cómo decidir si tratar el tiempo como continuo o discreto en el análisis de supervivencia. Específicamente, quiero usar el análisis de supervivencia para identificar las variables a nivel del hogar y del niño que tienen la mayor discrepancia en su impacto en la supervivencia de los niños frente a las niñas (hasta los 5 años). Tengo un conjunto de datos de edades de los niños (en meses) junto con un indicador de si el niño está vivo, la edad de la muerte (en meses) y otras variables a nivel del hogar y del niño.

Como el tiempo se registra en meses y todos los niños son menores de 5 años, hay muchos tiempos de supervivencia vinculados (a menudo a intervalos de medio año: 0mos, 6mos, 12mos, etc.). Según lo que he leído sobre el análisis de supervivencia, tener muchos tiempos de supervivencia vinculados me hace pensar que debería tratar el tiempo como algo discreto. Sin embargo, he leído varios otros estudios en los que el tiempo de supervivencia es, por ejemplo, años-persona (y seguramente hay tiempos de supervivencia vinculados) y se utilizan métodos de tiempo continuo como los riesgos proporcionales de Cox.

¿Cuáles son los criterios que debo usar para decidir si tratar el tiempo como continuo o discreto? Para mis datos y preguntas, usar algún modelo de tiempo continuo (Cox, Weibull, etc.) tiene un sentido intuitivo para mí, pero la naturaleza discreta de mis datos y la cantidad de tiempos de supervivencia vinculados parecen sugerir lo contrario.

Respuestas:


10

La elección del modelo de supervivencia debe guiarse por el fenómeno subyacente. En este caso, parece ser continuo, incluso si los datos se recopilan de manera algo discreta. Una resolución de un mes estaría bien durante un período de 5 años. Sin embargo, el gran número de lazos a los 6 y 12 meses hace que uno se pregunte si realmente tiene una precisión de 1 mes (se esperan los lazos a 0; ese es un valor especial donde realmente ocurren muchas muertes). No estoy muy seguro de lo que puede hacer al respecto, ya que esto probablemente refleja el redondeo posterior al hecho en lugar de la censura por intervalos.


2
Como regla general, si los datos discretos se pueden dividir en diez o más partes, se pueden tratar como continuos, incluso si son realmente discretos (el muestreo una vez al mes durante seis meses es muy diferente al muestreo semanal durante seis meses). o una vez al mes durante dos años). El siguiente artículo también da algunas ideas adicionales sobre el tratamiento de datos discretos como continuos: theanalysisfactor.com/count-data-considered-continuous
Tavrock

4

Sospecho que si usa modelos de tiempo continuo, querrá usar la censura de intervalos, lo que refleja el hecho de que no conoce el tiempo exacto de falla, solo un intervalo en el que ocurrió la falla. Si se ajustan los modelos de regresión paramétrica con censura de intervalo usando la máxima probabilidad, los tiempos de supervivencia vinculados no son un problema IIRC.


4

Habrá tiempos de supervivencia atados en la mayoría de los análisis, pero grandes y claros trozos de lazos en eventos particulares son preocupantes. Pensaría mucho sobre el estudio en sí mismo, cómo está recopilando datos, etc.

Porque, fuera de algunas necesidades metodológicas para usar un tipo de tiempo u otro, la forma de modelar la supervivencia dependerá de si el proceso subyacente es o no discreto o continuo en el mundo.


1

Si tiene covariables que varían con el tiempo para algunas personas (por ejemplo, el ingreso familiar puede variar en su ejemplo a lo largo de la vida de un niño), los modelos de supervivencia (paramétrico y modelo cox) requieren que divida los datos en intervalos discretos definidos por Las covariables variables.

Encontré este pdf de notas de clase de German Rodriguez útil.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.