Análisis de supervivencia bayesiano: por favor, ¡escríbeme un prior para Kaplan Meier!

Considere observaciones censuradas a la derecha, con eventos en los momentos . El número de individuos susceptibles en el momento es , y el número de eventos en el momento es . $t_1, t_2, \dots$ $i$ $n_i$ $i$ $d_i$

El estimador de Kaplan-Meier o producto surge naturalmente como un MLE cuando la función de supervivencia es una función escalonada . La probabilidad es entonces y el MLE es . $S(t) = \prod_{i : t_i < t} \alpha_i$

L (α) = \prod_{i} (1 - α_{i})^{d_{i}} α_{i}^{n_{i} - d_{i}}

$L(\alpha) = \prod_i (1-\alpha_i)^{d_i} \alpha_i^{n_i-d_i}$

{\hat{α}}_{i} = 1 - \frac{d_{i}}{n_{i}}

$\widehat\alpha_i = 1 - {d_i\over n_i}$

Bien, ahora asuma que quiero ir a Bayesian. Necesito algún tipo de `` natural '' anterior con el que multiplicaré , ¿verdad? $L(\alpha)$

Buscando en Google las palabras clave obvias, descubrí que el proceso de Dirichlet es un buen previo. Pero por lo que yo entiendo, también es un previo en los puntos de discontinuidad ? $t_i$

Esto es sin duda muy interesante y estoy ansioso por aprender al respecto, sin embargo, me conformaría con algo más simple. Empiezo a sospechar que no es tan fácil como pensé al principio, y es hora de pedirle su consejo ...

¡Muchas gracias de antemano!

PD: Un poco de precisión sobre lo que espero me interese (lo más simple posible) explicaciones sobre la forma de manejar el proceso de Dirichlet antes, sin embargo, creo que debería ser posible usar simplemente un previo en , es decir Un previo en el paso funciona con discontinuidades en . $\alpha_i$ $t_i$

Creo que la "forma global" de las funciones de paso muestreadas en el anterior no debería depender de las '- debería haber una familia subyacente de funciones continuas aproximadas por estas funciones de paso. $t_i$

No sé si debería ser independiente (lo dudo). Si lo son, creo que esto implica que la anterior depende de , y si denotamos su distribución por entonces el producto de una variable de una variable independiente es una variable . Parece aquí que las variables log- pueden ser útiles. $\alpha_i$ $\alpha_i$ $\Delta t_i = t_i - t_{i-1}$ $A(\Delta t)$ $A(\Delta_1)$ $A(\Delta_2)$ $A(\Delta_1+\Delta_2)$ $\Gamma$

Pero aquí básicamente estoy atascado. Al principio no escribí esto porque no quería dirigir todas las respuestas en esta dirección. Agradecería particularmente las respuestas con referencias bibliográficas para ayudarme a justificar mi elección final.

bayesian survival kaplan-meier

— Elvis
fuente

En el MLE, , ¿qué es ? ¿Es eso un error tipográfico? ¿Te refieres a ?

{\hat{a}}_{i} = 1 - \frac{d_{i}}{m_{i}}

$\hat{a}_{i} = 1 - \frac{d_{i}}{m_{i}}$

m_{i}

$m_{i}$

n_{i}

$n_{i}$

— stachyra

Sí, es , por supuesto. Corrijo.

n_{i}

$n_i$

— Elvis

En esta diapositiva , encontré este documento , cuyo autor también tiene esta introducción . Si esos no son suficientes como fuentes, sus propias referencias probablemente lo harán. También este video sobre procesos jerárquicos de Dirichlet.

— Sean Easter

Tenga en cuenta que entiendo las caracterizaciones básicas de DP pero no entiendo bien cómo usarlo, concretamente, como un previo ... Además, con qué medida base, etc.

— Elvis

¿Es esa función de probabilidad única? ¿O puedes obtener KM de otras posibilidades?

— probabilidadislogica

Respuestas:

Tenga en cuenta que debido a que su función de probabilidad es un producto de funciones , los datos le indican que no hay evidencia de correlación entre ellas. Tenga en cuenta que las variables ya están escalando para dar cuenta del tiempo. Un período de tiempo más largo significa más posibilidades de eventos, generalmente significa más grande . $\alpha_i$ $d_i$ $d_i$

La forma más básica de "volverse bayesiano" aquí es usar anteriores uniformes independientes . Tenga en cuenta que por lo que este es un previo adecuado, por lo tanto, el posterior también es apropiado. La posterior es distribuciones beta independientes con parámetros . Esto se puede simular fácilmente para generar la distribución posterior de la curva de supervivencia, utilizando la función en R, por ejemplo. $p (\alpha_i)=1$ $0 <\alpha_i <1$ $p (\alpha_i)\sim beta (n_i-d_i+1, d_i+1)$ rbeta ()

Creo que esto llega a su pregunta principal sobre un método "más simple". A continuación se presentan solo los comienzos de una idea para crear un modelo mejor, que conserve la forma KM flexible para la función de supervivencia.

Sin embargo, creo que el principal problema con la curva KM está en la función Supervivencia, y no en la anterior. Por ejemplo, ¿por qué los valores de corresponden a los puntos de tiempo que se observaron? ¿No tendría más sentido ubicarlos en puntos correspondientes a eventos significativos basados en el proceso real? Si los puntos de tiempo observados están demasiado separados, la curva KM será "demasiado suave". Si están demasiado cerca, la curva KM será "demasiado rugosa" y posiblemente exhibirá cambios abruptos. Una forma de lidiar con el problema "demasiado difícil" es colocar un previo correlacionado en tal que . El efecto de este previo será reducir los parámetros cercanos más cerca. Podrías usar esto en las "probabilidades de registro" $t_i$ $\alpha$ $\alpha_i\approx \alpha_{i+1}$ $\eta_i=\log\left (\frac {\alpha_i}{1-\alpha_i}\right)$ y use una caminata aleatoria de orden k antes de . Para una caminata aleatoria de primer orden, esto introduce penalizaciones de la forma en el log-verosimilitud. El software BayesX tiene una muy buena documentación de este tipo de suavizado. Básicamente, elegir el orden k es como hacer un polinomio local de orden k. Si te gustan las splines, elige k = 3. Por supuesto, al usar una cuadrícula de tiempo "fina" tendrá puntos de tiempo sin observaciones. Sin embargo, esto complica su función de probabilidad, ya que los faltan para algunos . Por ejemplo, si se dividió en 3 intervalos "más finos" $\eta$ $-\tau(\eta_i -\eta_{i-1})^2$ $n_i, d_i$ $i$ $( t_0,t_1)$ $(t_{00}, t_{01}, t_{02}, t_{10})$ entonces no sabe pero solo y . Por lo tanto, es probable que necesite agregar estos "datos faltantes" y usar un algoritmo EM o quizás VB (siempre que no vaya por la ruta mcmc). $n_{02}, n_{10}, d_{01}, d_{02}, d_{10}$ $n_1=n_{01}$ $d_1=d_{01}+d_{02}+d_{10}$

Espero que esto te de un comienzo.

— probabilidadislogica
fuente

Gracias por tus pensamientos (+1). Estaba usando el uniforme antes y creo que lo mantendré ... Mi verdadero problema es más complicado que el expuesto aquí, tengo correlaciones entre los . Esta "caminata aleatoria previa" en intrigante, voy a echar un vistazo.

α_{i}

$\alpha_i$

— Elvis

Para los lectores que enfrentan el problema de ir a Bayesian para estimar las funciones de supervivencia que aceptan la censura correcta, recomendaría el enfoque bayesiano no paramétrico desarrollado por F Mangili, A Benavoli et al. La única especificación previa es un parámetro (precisión o resistencia). Evita la necesidad de especificar el proceso de Dirichlet en caso de falta de información previa. Los autores proponen (1) - un estimador robusto de las curvas de supervivencia y sus intervalos creíbles para la probabilidad de supervivencia (2) - Una prueba en la diferencia de supervivencia de individuos de 2 poblaciones independientes que presenta varios beneficios sobre la prueba clásica de rango logarítmico u otras pruebas no paramétricas. Vea el paquete R IDPsurvival y esta referencia: Análisis de supervivencia confiable basado en el proceso de Dirichlet. F Mangili y col. Revista Biométrica. 2014.

— Pascal
fuente