Como se hizo evidente en los comentarios a la pregunta, los datos consisten en solo cuatro observaciones del tiempo hasta la explosión. (Sería un error analizarlos como si fueran 16 valores independientes). Consisten en intervalos de tiempos en lugar de tiempos exactos:
[1,8], [8,16], [16,24], [24,32]
Hay varios enfoques que uno podría tomar. Una muy atractiva y muy general es tomar estos intervalos en su palabra: el verdadero momento de la explosión de brotes podría ser cualquier cosa dentro de cada intervalo. Por lo tanto, se nos lleva a representar la "incertidumbre" en dos formas separadas: incertidumbre de muestreo (presumiblemente tenemos una muestra representativa de la especie este año) e incertidumbre de observación (reflejada por los intervalos).
La incertidumbre de muestreo se maneja con técnicas estadísticas familiares: se nos pide que calculemos la mediana y podemos hacerlo de varias maneras, dependiendo de los supuestos estadísticos, y podemos proporcionar intervalos de confianza para la estimación. Por simplicidad, supongamos que el tiempo para estallar brotes tiene una distribución simétrica. Debido a que es (presumiblemente) no negativo, esto implica que tiene una varianza y también sugiere que la media de incluso solo cuatro observaciones puede estar aproximadamente distribuida normalmente. Además, la simetría implica que podemos usar la media como un sustituto de la mediana (que se busca en la pregunta original). Esto nos da acceso a métodos estándar, simples, estimados e intervalos de confianza.
(1+8+16+24)/410.25(8+16+24+32)18
Mean=[10.25,18].
Esto representa un intervalo completo de estimaciones: ¡un resultado apropiado de un cálculo con entradas de intervalo!
1−αx=(x1,x2,x3,x4)ms
ucl(x,α)=x+tn−1(α)s/n−−√.
ucl((1,8,16,24),.025)28.0758ucl((8,11.676,16,24),.025)=25.8674Es más pequeño todavía. Al maximizar y minimizar el ucl entre todas las combinaciones posibles de valores consistentes con las observaciones, encontramos (por ejemplo) que
ucl(data,.025)=[25.8,39.3]
(¡ese es un intervalo de números que representa un intervalo valorado en ucl, no un intervalo de confianza!) y, para el límite de confianza inferior,
lcl(data,.025)=[0,6.2].
00
En palabras, podríamos decir que
"Estas observaciones son consistentes con valores que, si se hubieran medido con precisión , podrían dar como resultado un límite superior de confianza del 2.5% de la mediana de hasta 39.3 días, pero no más alto. Son consistentes con los valores (que podrían diferir del primero) eso daría como resultado un límite de confianza inferior del 2.5% tan bajo como 0. "
Lo que hay que hacer de esto es un asunto de contemplación individual y depende de la aplicación. Si se quiere estar razonablemente seguro de que el brote ocurre antes de los 40 días, entonces este resultado proporciona cierta satisfacción ( condicionalmente en los supuestos sobre la distribución del brote y la independencia de las observaciones ). Si se quiere estimar la explosión de brotes al día más cercano, entonces claramente se necesitan más datos. En otras circunstancias, esta conclusión estadística en términos de límites de confianza con valores de intervalo puede ser frustrante. Por ejemplo, ¿qué tan seguros podemos estar de que el brote se produce en el 50% de las muestras antes de los 30 días? Es difícil de decir, porque las respuestas serán intervalos.
Hay otras formas de manejar este problema. Estoy especialmente a favor de usar métodos de máxima verosimilitud. (Para aplicarlos aquí, necesitaríamos saber más sobre cómo se establecieron los puntos de corte del intervalo. Importa si se determinaron independientemente de los datos o no). La presente pregunta parece ser una buena oportunidad para introducir métodos basados en intervalos porque no parecen ser bien conocidos, aunque en ciertas disciplinas (evaluación de riesgos y análisis de algoritmos) algunas personas los han recomendado calurosamente.