El principal problema con estadísticas como el modelo CoxR2(descrito en otra respuesta) es que depende mucho de la distribución de censura de sus datos. Otras cosas naturales que puede observar, como la relación de probabilidad con el modelo nulo, también tienen este problema. (Esto se debe básicamente a que la contribución de un punto de datos censurado a la probabilidad es muy diferente de la contribución de un punto de datos donde se observa el evento, porque uno de ellos proviene de un PDF y uno de ellos proviene de un CDF). Varios investigadores han propuso formas de evitar esto, pero las que he visto generalmente requieren que tenga un modelo de distribución de censura o algo igualmente poco práctico. No he investigado qué tan grave es esta dependencia en la práctica, por lo que si su censura es bastante leve, aún podría analizar estadísticas basadas en la razón de probabilidad. Para los modelos CART de supervivencia,
Para los modelos de supervivencia genéricos, una estadística de uso frecuente es el índice c de Harrell , un análogo de Kendall's o el ROC AUC para los modelos de supervivencia. Esencialmente, c es la proporción, de todas las instancias donde sabe que una instancia experimentó un evento más tarde que la otra, que el modelo se clasifica correctamente. (En otras palabras, para que se incluyan un par de instancias en el denominador aquí, como máximo una puede ser censurada, y debe censurarse después de que la otra experimente un evento). El índice c también depende de la distribución de censura, pero Según Harrell, la dependencia es más leve que para las otras estadísticas que mencioné anteriormente. Desafortunadamente, Harrell's cτtambién es menos sensible que las estadísticas anteriores, por lo que es posible que no desee elegir entre modelos basados en él si la diferencia entre ellos es pequeña; Es más útil como índice interpretable de rendimiento general que como una forma de comparar diferentes modelos.
(Por último, por supuesto, si tiene un propósito específico en mente para los modelos, es decir, si sabe cuál es su función de pérdida de predicción, ¡siempre puede evaluarlos de acuerdo con la función de pérdida! Pero supongo que ' no eres tan afortunado ...)
Para una discusión más profunda tanto de las estadísticas de razón de probabilidad como de la c de Harrell , debe consultar el excelente libro de texto de Harrell Estrategias de modelado de regresión . La sección sobre evaluación de modelos de supervivencia es §19.10, pp. 492-493. Lo siento, no puedo darte una sola respuesta definitiva, ¡pero no creo que este sea un problema resuelto!