La censura a menudo se describe en comparación con el truncamiento . Gelman et al (2005, p. 235) proporcionan una buena descripción de los dos procesos:
Los datos truncados difieren de los datos censurados en que no hay disponible un recuento de observaciones más allá del punto de truncamiento. Con la censura, los
valores de las observaciones más allá del punto de truncamiento se pierden, pero se observa su número.
La censura o el truncamiento pueden ocurrir para valores superiores a cierto nivel (censura a la derecha), inferiores a cierto nivel (censura a la izquierda), o ambos.
2,02,0
Un ejemplo intuitivo de censura es que usted pregunta a sus encuestados acerca de su edad, pero lo registra solo hasta cierto valor y todas las edades por encima de este valor, digamos 60 años, se registran como "60+". Esto lleva a tener información precisa para valores no censurados y no hay información sobre valores censurados.
No tan típico, se observó un ejemplo real de censura en los puntajes de los exámenes de matura polacos que llamaron mucho la atención en Internet . El examen se toma al final de la escuela secundaria y los estudiantes deben aprobarlo para poder solicitar la educación superior. ¿Puedes adivinar en la siguiente gráfica cuál es la cantidad mínima de puntos que los estudiantes necesitan para aprobar el examen? No es sorprendente que la "brecha" en la distribución normal se pueda "rellenar" fácilmente si se toma una fracción adecuada de las puntuaciones sobrerrepresentadas justo por encima de la frontera de censura.
En caso de análisis de supervivencia.
la censura ocurre cuando tenemos información sobre el tiempo de supervivencia individual, pero no sabemos exactamente el tiempo de supervivencia
(Kleinbaum y Klein, 2005, p. 5). Por ejemplo, usted trata a los pacientes con algún medicamento y los observa hasta el final de su estudio, pero no sabe qué les sucede después de que finaliza el estudio (¿hubo alguna recaída o efectos secundarios?), Lo único que sabe es que " sobrevivió " al menos hasta el final del estudio.
A continuación puede encontrar ejemplos de datos generados a partir de la distribución Weibull modelada con el estimador Kaplan-Meier. La curva azul marca el modelo estimado en el conjunto de datos completo, en el gráfico central puede ver la muestra censurada y el modelo estimado en los datos censurados (curva roja), a la derecha verá la muestra truncada y el modelo estimado en dicha muestra (curva roja). Como puede ver, los datos faltantes (truncamiento) tienen un impacto significativo en las estimaciones, pero la censura se puede gestionar fácilmente utilizando modelos de análisis de supervivencia estándar.
Esto no significa que no pueda analizar muestras truncadas, pero en tales casos debe usar modelos para datos faltantes que intentan "adivinar" la información desconocida.
Kleinbaum, DG y Klein, M. (2005). Análisis de supervivencia: un texto de autoaprendizaje. Saltador.
Gelman, A., Carlin, JB, Stern, HS y Rubin, DB (2005). Análisis de datos bayesianos. Chapman & Hall / CRC.