¿Cuál es la diferencia entre la salida "coef" y "(exp) coef" de coxph en R?

14

He estado tratando de discernir qué significa exactamente la salida "coef" y "(exp) coef" de coxph. Parece que el "(exp) coef" son comparaciones de la primera variable en el modelo de acuerdo con el grupo asignado en el comando.

¿Cómo llega la función coxph a los valores de "coef" y "(exp) coef"?

Además, ¿cómo determina Coxph estos valores cuando hay censura involucrada?

r survival interpretation

— annemphillip
fuente

21

Si tiene una sola variable explicativa, digamos grupo de tratamiento, se ajusta un modelo de regresión de Cox coxph(); el coeficiente ( coef) se lee como un coeficiente de regresión (en el contexto del modelo de Cox, descrito a continuación) y su exponencial le brinda el riesgo en el grupo de tratamiento (en comparación con el grupo control o placebo). Por ejemplo, si , entonces el peligro es , es decir, 16.5%. $\hat\beta=-1.80$ $\exp(-1.80)=0.165$

Como sabrán, la función de peligro se modela como

h (t) = h_{0} (t) \exp (β^{'} x)

$h(t)=h_0(t)\exp(\beta'x)$

donde es el peligro de referencia. Los riesgos dependen multiplicativamente de las covariables, y es la relación de los riesgos entre dos individuos cuyos valores de difieren en una unidad cuando todas las demás covariables se mantienen constantes. La razón de los riesgos de cualquiera de los dos individuos y es , y se denomina razón de riesgo (o razón de tasa de incidencia). Se supone que esta relación es constante en el tiempo, de ahí el nombre de peligro proporcional . $h_0(t)$ $\exp(\beta_1)$ $x_1$ $i$ $j$ $\exp\big(\beta'(x_i-x_j)\big)$

Para hacer eco de su pregunta anterior survreg, aquí la forma de se deja sin especificar; más precisamente, este es un modelo semiparamétrico en el que solo se parametrizan los efectos de las covariables, y no la función de peligro. En otras palabras, no hacemos ninguna suposición de distribución sobre los tiempos de supervivencia. $h_0(t)$

Los parámetros de regresión se estiman maximizando la probabilidad de registro parcial definida por

ℓ = \sum_{f} \log (\frac{\exp (β^{'} x_{f})}{\sum_{r (f)} \exp (β^{'} x_{r})})

$\ell=\sum_f\log\left(\frac{\exp(\beta'x_f)}{\sum_{r(f)}\exp(\beta'x_r)}\right)$

donde la primera suma es sobre todas las muertes o fallas , y la segunda suma es sobre todos los sujetos aún están vivos (pero en riesgo) en el momento del fracaso, esto se conoce como el conjunto de riesgos . En otras palabras, puede interpretarse como la probabilidad de perfil de registro para después de eliminar (o en otras palabras, el LL donde el ha sido reemplazado por funciones de que maximizan la probabilidad con respecto a para un vector fijo ). $f$ $r(f)$ $\ell$ $\beta$ $h_0(t)$ $h_0(t)$ $\beta$ $h_0(t)$ $\beta$

Sobre la censura, no está claro si se refiere a la censura a la izquierda (como podría ser el caso si consideramos un origen para la escala de tiempo que es anterior al momento en que comenzó la observación, también llamada entrada retardada ), o censura a la derecha. En cualquier caso, se pueden encontrar más detalles sobre el cálculo de los coeficientes de regresión y cómo el paquete de supervivencia maneja la censura en Therneau y Grambsch, Modeling Survival Data (Springer, 2000). Terry Therneau es el autor del antiguo paquete S. Un tutorial en línea está disponible.

El Análisis de supervivencia en R , de David Diez, proporciona una buena introducción al Análisis de supervivencia en R. Se proporciona una breve descripción de las pruebas para los parámetros de regresión p. 10. Con suerte, esto debería ayudar a aclarar la ayuda en línea citada por @onestop , "coeficientes los coeficientes del predictor lineal, que multiplican las columnas de la matriz del modelo". Para un libro de texto aplicado, recomiendo analizar los datos médicos con S-PLUS , de Everitt y Rabe-Hesketh (Springer, 2001, cap. 16 y 17), de donde proviene la mayor parte de lo anterior. Otra referencia útil es el apéndice de John Fox sobre la regresión de riesgos proporcionales de Cox para datos de supervivencia . $\chi^2$

— chl
fuente

44

+1, esta es una respuesta realmente informativa a una pregunta bastante simple y directa. Aprecio especialmente los enlaces a los recursos para obtener más información. Nota: el enlace al tutorial en línea de Terry Therneau está muerto; Un paquete para el análisis de supervivencia en S puede ser un enlace en vivo al mismo material.

— gung - Restablece a Monica

5

Para citar la documentación del método de impresión para un objeto coxph, obtenido en R escribiendo ?survival::print.coxph:

coefficients Los coeficientes del predictor lineal, que multiplican las columnas de la matriz del modelo.

Esa es toda la documentación que proporciona el autor del paquete. El paquete no contiene ninguna guía de usuario o viñeta de paquete. R no está diseñado para ser fácil de usar, y la documentación asume que ya ha entendido los métodos estadísticos involucrados.

Supongo que la coefcolumna da lo anterior coefficients, y la exp(coef)columna es el exponencial de estos. Como la regresión de Cox implica una función de enlace logarítmico, los coeficientes son las razones de riesgo logarítmico . Exponiéndolos, por lo tanto, le devuelve proporciones de riesgo.

— una parada
fuente