Tengo un experimento que producirá observaciones del tiempo hasta que ocurra un evento. Algunas propiedades básicas son que
- Contamos el número de eventos que ocurrieron en algún momento .
- Los tiempos de evento son censurados por intervalo, entre ,
- Los individuos no abandonarán la prueba entre , es decir, un individuo experimenta el evento por o no, en cuyo punto son censurados,
- Una gran proporción de los individuos no recibirá el evento por , cuando finalicemos el experimento, y
- No puedo asumir ningún modelo de decaimiento paramétrico subyacente.
Parece ser una aplicación natural para el análisis de supervivencia. Sin embargo, es complicado por el hecho de que es trivial repetir el experimento desde la misma configuración inicial varias veces. En efecto, tendremos un conjunto de recuentos de eventos (donde es el número de muestras) para cada tiempo de observación . Soy relativamente nuevo en estadísticas y me cuesta ver cómo aplicar el análisis de supervivencia a estos datos (si es aplicable y no existen métodos más apropiados para medir este tipo de datos de tiempo hasta el evento). Mi inclinación es construir la función de supervivencia alrededor del número medio de eventos observados en cada intervalo (es decir,), que debería aproximarse mejor al número esperado de eventos en cada intervalo de la población, sin embargo, no tengo idea de si esto es apropiado o de sus implicaciones.
He buscado en vano en Google Académico, si alguien pudiera señalarme más material (o darme la nomenclatura correcta para lo que estoy tratando de hacer), sería apreciado.
Editar
Dado que los intervalos son uniformes en todas las muestras, digamos que tenía la siguiente matriz que describe el número acumulado de individuos para los cuales ha ocurrido un evento en cada intervalo
donde cada fila proporciona el recuento de eventos para el mismo conjunto de individuos en riesgo en en todas las muestras (es decir, múltiples instancias del experimento), y cada columna es un intervalo de observación. Supongo que al tomar el número medio de eventos para cada intervalo, puedo obtener una mejor estimación de la supervivencia de la población esperada, así que denote el número de intervalos de tiempo, denote el número de muestras (instancias de experimento), luego el vector
será el número medio de eventos observados para cada intervalo de tiempo.
Mi objetivo, entonces, es usar esto como la entrada para la estimación de supervivencia. Sea el número de individuos en riesgo cuando . Usando el estimador ingenuo (por ahora, dado que los intervalos de eventos son uniformes en todas las muestras y no hay censura hasta ), la función de supervivencia podría estimarse como:
Lo cual (con suerte) sería una mejor estimación de la supervivencia de la población que cualquier muestra individual (una sola fila de ). Para reformular mi pregunta:
- ¿Es una entrada apropiada para una estimación de la función de supervivencia? No he visto este enfoque en ninguno de los materiales que he leído.
- Como soy realmente, dolorosamente un novato en estadística, ¿alguien puede señalarme algún material (documentos académicos, libros de texto, wikis, etc. estaría bien) para estimar el intervalo de confianza y la varianza para esta estimación de la función de supervivencia? Supongo que no será idéntico a las formulaciones estándar.
Disculpas si mi pregunta original era confusa, probablemente no incluí suficiente información.