(Tenga en cuenta que en la parte que citó, el enunciado era condicional; la oración en sí no asumía una supervivencia exponencial, explicaba una consecuencia de hacerlo. Sin embargo, la suposición de supervivencia exponencial es común, por lo que vale la pena abordar la cuestión de "por qué exponencial "y" por qué no es normal ", dado que el primero ya está bastante bien cubierto, me concentraré más en el segundo)
Los tiempos de supervivencia normalmente distribuidos no tienen sentido porque tienen una probabilidad distinta de cero de que el tiempo de supervivencia sea negativo.
Si luego restringe su consideración a distribuciones normales que casi no tienen posibilidades de estar cerca de cero, no puede modelar datos de supervivencia que tengan una probabilidad razonable de un tiempo de supervivencia corto:
Tal vez, de vez en cuando, los tiempos de supervivencia que casi no tienen posibilidades de tiempos de supervivencia cortos serían razonables, pero necesita distribuciones que tengan sentido en la práctica; por lo general, observa tiempos de supervivencia cortos y largos (y cualquier cosa intermedia), con un sesgo típicamente sesgado distribución de tiempos de supervivencia). Una distribución normal no modificada rara vez será útil en la práctica.
[Una normal truncada podría ser más a menudo una aproximación aproximada razonable que una normal, pero otras distribuciones a menudo serán mejores.]
El riesgo constante de la exponencial es a veces una aproximación razonable para los tiempos de supervivencia. Por ejemplo, si los "eventos aleatorios" como el accidente son un contribuyente importante a la tasa de mortalidad, la supervivencia exponencial funcionará bastante bien. (Entre las poblaciones animales, por ejemplo, a veces, tanto la depredación como la enfermedad pueden actuar al menos aproximadamente como un proceso fortuito, dejando algo así como una exponencial como una primera aproximación razonable a los tiempos de supervivencia).
Una pregunta adicional relacionada con la normal truncada: si lo normal no es apropiado, ¿por qué no normal al cuadrado (chi sq con df 1)?
De hecho, eso podría ser un poco mejor ... pero tenga en cuenta que eso correspondería a un peligro infinito en 0, por lo que solo sería útil ocasionalmente. Si bien puede modelar casos con una proporción muy alta de tiempos muy cortos, tiene el problema inverso de solo poder modelar casos con una supervivencia típicamente mucho más corta que la media (el 25% de los tiempos de supervivencia están por debajo del 10,15% del tiempo medio de supervivencia y la mitad de los tiempos de supervivencia son menos del 45,5% de la media; es decir, la supervivencia media es menos de la mitad de la media).
Veamos un escalado χ21 (es decir, un gamma con parámetro de forma 12):
[Tal vez si sumas dos de esos χ21 varía ... o tal vez si consideraste no central χ2obtendrías algunas posibilidades adecuadas. Fuera de lo exponencial, las opciones comunes de distribuciones paramétricas para tiempos de supervivencia incluyen Weibull, lognormal, gamma, log-logistic entre muchos otros ... tenga en cuenta que Weibull y gamma incluyen el exponencial como un caso especial]