Una cosa a tener en cuenta con la curva de supervivencia de Kaplan-Meier es que es básicamente descriptiva y no inferencial . Es solo una función de los datos, con un modelo increíblemente flexible que se encuentra detrás de ellos. Esto es una fortaleza porque significa que prácticamente no hay supuestos que puedan romperse, sino una debilidad porque es difícil generalizarlo y que se ajusta al "ruido" y a la "señal". Si desea hacer una inferencia, entonces básicamente tiene que introducir algo desconocido que desea saber.
Ahora, una forma de comparar los tiempos medios de supervivencia es hacer los siguientes supuestos:
- Tengo una estimación de la mediana del tiempo de supervivencia para cada uno de los estados i , dada por la curva de kaplan meier.tyoyo
- Espero que el tiempo medio de supervivencia real, sea igual a esta estimación. E ( T i | t i ) = t iTyomi( TyoEl | tyo) = tyo
- Estoy 100% seguro de que el verdadero tiempo de supervivencia promedio es positivo. PAGr ( Tyo> 0 ) = 1
Ahora, la forma "más conservadora" de utilizar estos supuestos es el principio de máxima entropía, por lo que obtienes:
p ( TyoEl | tyo) = Ke x p ( - λ Tyo)
Donde se eligen y λ de modo que el PDF se normalice, y el valor esperado es t i . Ahora tenemos:Kλtyo
=K[-exp(-λ T i )
1 = ∫∞0 0p ( TyoEl | tyo) dTyo= K∫∞0 0e x p ( - λ Tyo) dTyo
y ahora tenemos
E ( T i ) = 1= K[ - e x p ( - λ Tyo)λ]Tyo= ∞Tyo= 0= Kλ⟹K= λ
mi( Tyo) = 1λ⟹λ = t- 1yo
Y así tiene un conjunto de distribuciones de probabilidad para cada estado.
p ( TyoEl | tyo) = 1tyoe x p ( - Tyotyo)( i = 1 , ... , N)
Que dan una distribución de probabilidad conjunta de:
p ( T1, T2, ... , TnorteEl | t1, t2, ... , tnorte) = ∏i = 1norte1tyoe x p ( - Tyotyo)
Ahora parece que quiere probar la hipótesis H0 0: T1= T2= ⋯ = Tnorte= t¯es la mediana del tiempo medio de supervivencia. La hipótesis alternativa severa para probar es la hipótesis de "cada estado es un copo de nieve único y hermoso"t¯= 1norte∑nortei = 1tyoHUN: T1= t1, ... , Tnorte= tnorte
O ( HUNEl | H0 0) = p ( T1= t1, T2= t2, ... , Tnorte= tnorteEl | t1, t2, ... , tnorte)p ( T1= t¯, T2= t¯, ... , Tnorte= t¯El | t1, t2, ... , tnorte)
= [ ∏nortei = 11tyo] exp ( - ∑nortei = 1tyotyo)[ ∏nortei = 11tyo] exp ( - ∑nortei = 1t¯tyo)= e x p ( N[ t¯th a r m- 1 ] )
Dónde
th a r m= [ 1norte∑i = 1nortet- 1yo]- 1≤ t¯
es la media armónica Tenga en cuenta que las probabilidades siempre favorecerán el ajuste perfecto, pero no mucho si los tiempos medios de supervivencia son razonablemente cercanos. Además, esto le brinda una forma directa de establecer la evidencia de esta prueba de hipótesis particular:
O ( HUNEl | H0 0) : 1
Combine esto con una regla de decisión, función de pérdida, función de utilidad, etc., que diga lo ventajoso que es aceptar la hipótesis más simple, ¡y ya tiene su conclusión!
H0 0
HS, i: Tyo= tyo, Tj= T= t¯( i )= 1norte- 1∑j ≠ itj
yo
- HUNHS, i
- H0 0HS, i
- una diferente HS, kkyo
Ahora, una cosa que se ha pasado por alto aquí es la correlación entre estados: esta estructura supone que conocer la tasa de supervivencia media en un estado no le dice nada sobre la tasa de supervivencia media en otro estado. Si bien esto puede parecer "malo", no es difícil mejorarlo, y los cálculos anteriores son buenos resultados iniciales que son fáciles de calcular.
Agregar conexiones entre estados cambiará los modelos de probabilidad, y verá efectivamente una "agrupación" de los tiempos de supervivencia promedio. Una forma de incorporar correlaciones en el análisis es separar los verdaderos tiempos de supervivencia en dos componentes, una "parte común" o "tendencia" y una "parte individual":
Tyo= T+ Uyo
Y luego restringir la parte individual Uyoσ