Análisis de supervivencia para predicción de eventos.

Para cada registro en mis conjuntos de datos tengo la siguiente información

(X_{1}, \dots, X_{m}, δ, T)

$(X_1 \ , \dots \ , X_m \ , \delta \ , T \ )$

donde son características, es 1 si ocurre el evento objetivo y 0 en caso contrario, y es la marca de tiempo del evento ocurrido. En particular, podría faltar si no hubo un evento o se estableció a la hora en que terminó el seguimiento. $X_i$ $\delta$ $T$ $T$

Quiero calcular un índice de riesgo para cada registro en mi conjunto de datos.

Estaba pensando en un modelo de clasificación que usara las características para predecir la clase . Sin embargo, es importante: si el evento $X_i$ $\delta$ $T$ $\delta$ es probable que ocurra pronto, el riesgo debería ser mayor.

Es por eso que un análisis de supervivencia debe ser adecuado para este problema. No necesito la estimación completa de $S(t) = P(T>t)$ sino solo un índice único que represente el riesgo para un solo registro.

El tiempo medio de supervivencia, que se puede calcular para cada registro, parece un buen índice de riesgo: cuanto menor es el riesgo.

Mi pregunta es:

¿El análisis de supervivencia es adecuado para mis propósitos?
¿Cómo puedo evaluar el rendimiento de mi modelo?

$c$

$c$

$X_i(t)$

classification survival

— Simone
fuente

¿El análisis de supervivencia es adecuado para mis propósitos?

Lo único que hace que esto parezca menos aplicable para el análisis de supervivencia es:

$TT$

Necesitará saber el último período en que se observó que la persona estuvo viva para la mayoría de los modelos. De lo contrario, debe ser sencillo y aplicable para utilizar el análisis de supervivencia. Por ejemplo, riesgo proporcional de Cox con survival::coxphen R o modelos paramétricos con survival::survreg.

El tiempo medio de supervivencia, que se puede calcular para cada registro, parece un buen índice de riesgo: cuanto menor es el riesgo.

Sí, puede usar los tiempos de supervivencia promedio o simplemente el predictor lineal para los dos modelos (clases de) mencionados anteriormente.

¿Cómo puedo evaluar el rendimiento de mi modelo?

$c$ Hmisc::rcorr.cens

— Benjamin Christoffersen
fuente