Explicación del laico de la censura en el análisis de supervivencia

13

He leído sobre qué es la censura y cómo debe tenerse en cuenta en el análisis de supervivencia, pero me gustaría escuchar una definición menos matemática y una definición más intuitiva (¡las imágenes serían geniales!). ¿Alguien me puede dar una explicación de 1) censurar y 2) cómo afecta a cosas como las curvas de Kaplan-Meier y la regresión de Cox?

survival cox-model censoring

— OxidadoEstadístico
fuente

Sugiero escuchar el podcast Linear Digression sobre análisis de supervivencia y escuchar su definición simplificada de censura izquierda y derecha y la motivación para el modelo cox.

— Uri Goren

16

La censura a menudo se describe en comparación con el truncamiento . Gelman et al (2005, p. 235) proporcionan una buena descripción de los dos procesos:

Los datos truncados difieren de los datos censurados en que no hay disponible un recuento de observaciones más allá del punto de truncamiento. Con la censura, los valores de las observaciones más allá del punto de truncamiento se pierden, pero se observa su número.

La censura o el truncamiento pueden ocurrir para valores superiores a cierto nivel (censura a la derecha), inferiores a cierto nivel (censura a la izquierda), o ambos.

$2.0$ $2.0$

Un ejemplo intuitivo de censura es que usted pregunta a sus encuestados acerca de su edad, pero lo registra solo hasta cierto valor y todas las edades por encima de este valor, digamos 60 años, se registran como "60+". Esto lleva a tener información precisa para valores no censurados y no hay información sobre valores censurados.

No tan típico, se observó un ejemplo real de censura en los puntajes de los exámenes de matura polacos que llamaron mucho la atención en Internet . El examen se toma al final de la escuela secundaria y los estudiantes deben aprobarlo para poder solicitar la educación superior. ¿Puedes adivinar en la siguiente gráfica cuál es la cantidad mínima de puntos que los estudiantes necesitan para aprobar el examen? No es sorprendente que la "brecha" en la distribución normal se pueda "rellenar" fácilmente si se toma una fracción adecuada de las puntuaciones sobrerrepresentadas justo por encima de la frontera de censura.

En caso de análisis de supervivencia.

la censura ocurre cuando tenemos información sobre el tiempo de supervivencia individual, pero no sabemos exactamente el tiempo de supervivencia

(Kleinbaum y Klein, 2005, p. 5). Por ejemplo, usted trata a los pacientes con algún medicamento y los observa hasta el final de su estudio, pero no sabe qué les sucede después de que finaliza el estudio (¿hubo alguna recaída o efectos secundarios?), Lo único que sabe es que " sobrevivió " al menos hasta el final del estudio.

A continuación puede encontrar ejemplos de datos generados a partir de la distribución Weibull modelada con el estimador Kaplan-Meier. La curva azul marca el modelo estimado en el conjunto de datos completo, en el gráfico central puede ver la muestra censurada y el modelo estimado en los datos censurados (curva roja), a la derecha verá la muestra truncada y el modelo estimado en dicha muestra (curva roja). Como puede ver, los datos faltantes (truncamiento) tienen un impacto significativo en las estimaciones, pero la censura se puede gestionar fácilmente utilizando modelos de análisis de supervivencia estándar.

Esto no significa que no pueda analizar muestras truncadas, pero en tales casos debe usar modelos para datos faltantes que intentan "adivinar" la información desconocida.

Kleinbaum, DG y Klein, M. (2005). Análisis de supervivencia: un texto de autoaprendizaje. Saltador.

Gelman, A., Carlin, JB, Stern, HS y Rubin, DB (2005). Análisis de datos bayesianos. Chapman & Hall / CRC.

— Tim
fuente

¿Sabes de dónde viene esta trama de Matura? Intenté buscar en Google y seguir obteniendo el enlace reddit, pero ese no contiene ninguna referencia. Simplemente lleva a imgur.com sin ninguna atribución. ACTUALIZACIÓN: Lo encontré. cke.edu.pl//images/files/matura/informacje_o_wynikach/2013/… página 18.

— amoeba dice Reinstate Monica

1

@amoeba si estaba interesado en más detalles, no dude en ponerse en contacto conmigo. Lamentablemente, la mayoría de los materiales sobre este tema que conozco están en polaco. La imagen es una cosa, pero un amigo mío hizo un análisis más detallado de estos datos (por cierto, está disponible a pedido).

— Tim

2

La censura es fundamental para el análisis de supervivencia.

La idea básica es que la información está censurada, es invisible para usted. Explicado simplemente, se obtiene una distribución censurada de los tiempos de vida si registra los tiempos de vida antes de que todos en la muestra hayan muerto. Si piensa que el tiempo se mueve "hacia la derecha" en el eje X, esto puede llamarse censura a la derecha.

También hay otros tipos: censura a la izquierda y censura de ventanas. Vea, por ejemplo, el texto de Allison de 1984 sobre el Análisis de Historia de Eventos, publicado por Sage para una introducción instructiva.

Ejemplo: si está calculando las tasas de divorcio en la población, solo desea incluir a las personas que corren el riesgo de divorciarse (es decir, están casadas). Si las personas terminan su matrimonio por razones distintas al divorcio (duelo, anulación), entonces desea censurarlas. Ya no corren el riesgo de divorciarse. Sus estimaciones (y gráficos) de Kaplan-Meier no deben incluir observaciones censuradas después del momento en que se censuran, sino que deben incluirlas hasta ese momento.

— torkildl
fuente

Gráficos o tramas?

— RustyStatistician