Regresión de Cox y escala de tiempo


9

¿La variable X (peligro) en el análisis de regresión de riesgo proporcional de Cox siempre tiene que ser tiempo? Si no, ¿podría dar un ejemplo, por favor?

¿La edad del paciente con cáncer puede ser una variable de riesgo? Si es así, ¿puede interpretarse como el riesgo de contraer cáncer a cierta edad? ¿Sería la regresión de Cox un análisis legítimo para estudiar la asociación entre la expresión génica y la edad?

Respuestas:


8

Por lo general, la edad al inicio se usa como una covariable (porque a menudo se asocia a enfermedad / muerte), pero también se puede usar como su escala de tiempo (creo que se usa en algunos estudios longitudinales, porque necesita tener suficiente personas en riesgo a lo largo de la escala de tiempo, pero no puedo recordar en realidad: acabo de encontrar estas diapositivas sobre Análisis de estudios de cohortes asumiendo una escala de tiempo continua que habla sobre estudios de cohortes). En la interpretación, debe reemplazar el tiempo del evento por edad, y puede incluir la edad en el momento del diagnóstico como una covariable. Esto tendría sentido cuando estudie la mortalidad específica por edad de una enfermedad en particular (como se ilustra en estas diapositivas ).

Quizás este artículo sea interesante ya que contrasta los dos enfoques, tiempo de estudio versus edad cronológica: Escalas de tiempo en el modelo de Cox: efecto de la variabilidad entre las edades de entrada en las estimaciones de coeficientes . Aquí hay otro artículo:

Cheung, YB, Gao, F y Khoo, KS (2003). Edad al diagnóstico y elección de métodos de análisis de supervivencia en epidemiología del cáncer . Journal of Clinical Epidemiology , 56 (1), 38-43.

Pero ciertamente hay mejores papeles.


@chi: Muchas gracias. Voy a mirar los papeles. ¿Podría comentar la primera pregunta? ¿La variable de peligro es siempre el tiempo?
yuk

@yuk No necesariamente, como lo sugiere @whuber. Tengo en mente otra aplicación de la regresión de Cox que trata el tratamiento del patrón sistemático de respuestas faltantes en las pruebas educativas, ya que surge cuando un estudiante no tiene tiempo suficiente para completar la prueba (las respuestas faltantes pueden considerarse como censuradas por la derecha) - - en este caso, este es el pedido de artículos que se considera como la escala de tiempo. Veré el artículo original (aunque creo que este también fue el tema de un doctorado).
chl

+1. Hay otros documentos, pero no estoy seguro de que sean necesariamente mejores; Creo que Chalise hace un buen trabajo resumiendo la situación.
ars

7

No, no siempre tiene que ser el tiempo. Muchas respuestas censuradas se pueden modelar con técnicas de análisis de supervivencia. En su libro Nondetects and Data Analysis , Dennis Helsel aboga por usar lo negativo de una concentración en lugar de tiempo (para hacer frente a las no detecciones, que cuando se niegan se convierten en valores censurados por la derecha). Una sinopsis está disponible en la Web (formato pdf) y un paquete R, NADA , implementa esto.


+1, gracias por señalar el paquete NADA. Me di cuenta de que facilita el manejo de datos censurados a la izquierda a través del paquete de supervivencia: ¿es un escenario común censurado a la izquierda con datos ambientales?
ars

@whuber: Gracias por el comentario, el paquete NADA se ve muy interesante.
yuk

@Andy: Gracias por los enlaces. Creo que vale la pena ser una respuesta. Me gustaría votar.
yuk

@Yuk, por su solicitud, hice mi comentario en una respuesta, y @whuber gracias por su ejemplo.
Andy W

@ars: Sí, la censura a la izquierda es característica de los datos ambientales (y es una preocupación clave de la quimiometría en general). Es un problema complicado e interesante. Entre las razones están (1) los límites de censura están determinados por estimaciones estadísticas (a través de un proceso de calibración), (2) la censura puede ocurrir de varias maneras: como límites de detección, límites de cuantificación o "límites de informes", ( 3) los umbrales a menudo varían en respuesta a covariables ("interferencias de la matriz") que pueden estar fuertemente correlacionadas con los valores censurados originales, (4) los datos a menudo se distribuyen de manera lognormal.
whuber

4

En el tema de la escala de edad frente a la escala de tiempo, chl tiene algunas buenas referencias y captura lo esencial, en particular, el requisito de que el conjunto en riesgo contenga suficientes sujetos de todas las edades como surgiría en un estudio longitudinal.

Solo señalaría que todavía no existe un consenso general sobre esto, pero existe cierta literatura que sugiere que la edad debería preferirse como la escala de tiempo en ciertos casos. En particular, si tiene una situación en la que el tiempo no se acumula de la misma manera para todos los sujetos, por ejemplo, debido a la exposición a algún material tóxico, entonces la edad puede ser más apropiada.

Por otro lado, puede manejar ese ejemplo específico en un modelo Cox PH de escala de tiempo utilizando la edad como una covariable variable en el tiempo, en lugar de una covariable fija en el momento de inicio. Debe pensar en el mecanismo detrás de su objeto de estudio para determinar qué escala de tiempo es más apropiada. A veces vale la pena ajustar ambos modelos a los datos existentes para ver si surgen discrepancias y cómo podrían explicarse antes de diseñar su nuevo estudio.

Finalmente, la diferencia obvia al analizar los dos es que, en una escala de edad, la interpretación de la supervivencia es con respecto a una escala absoluta (edad), mientras que en una escala de tiempo, es relativa a la fecha de inicio / entrada del estudio. .


3

Según la solicitud del OP, aquí hay otra aplicación que he visto que el análisis de supervivencia utilizado en un contexto espacial (aunque obviamente diferente a la medición de sustancias ambientales mencionadas por whuber) está modelando la distancia entre eventos en el espacio. Aquí hay un ejemplo en criminología y aquí hay uno en epidemiología .

El razonamiento detrás del uso del análisis de supervivencia para medir la distancia entre eventos no es, por ejemplo, un problema de censura (aunque la censura puede ocurrir definitivamente en un contexto espacial), lo es más debido a las distribuciones similares entre las características de tiempo a evento y la distancia entre eventos características (es decir, ambos tienen tipos similares de estructuras de error (frecuentemente disminución de distancia) que violan OLS y, por lo tanto, las soluciones no paramétricas son ideales para ambos).


Debido a mis malas prácticas de citas tuve que pasar y horas buscando el enlace / referencia correcto al enlace de arriba.

Por ejemplo en criminología,

Kikuchi, George, Mamoru Amemiya, Tomonori Saito, Takahito Shimada y Yutaka Harada. 2010. Un análisis espacio-temporal de la victimización casi repetida en Japón . 8ª Conferencia Nacional de Mapeo del Crimen. Instituto Jill Dando de Ciencia del Crimen. PDF actualmente disponible en la página web referenciada.

En epidemiología,

Lector, Steven. 2000. Uso del análisis de supervivencia para estudiar patrones de puntos espaciales en epidemiología geográfica. Social Science & Medicine 50 (7-8): 985-1000.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.