Considere un experimento que genera una relación entre 0 y 1. La forma en que se obtiene esta relación no debería ser relevante en este contexto. Se elaboró en una versión anterior de esta pregunta , pero se eliminó para mayor claridad después de una discusión sobre meta .
Este experimento se repite veces, mientras que es pequeño (aproximadamente 3-10). Se supone que es independiente e idénticamente distribuido. A partir de estos, estimamos la media calculando el promedio , pero ¿cómo calcular el intervalo de confianza correspondiente ?n X i ¯ X [ U , V ]
Cuando se utiliza el enfoque estándar para calcular los intervalos de confianza, veces es mayor que 1. Sin embargo, mi intuición es que el intervalo de confianza correcto ...
- ... debe estar dentro del rango 0 y 1
- ... debería hacerse más pequeño con el aumento de
- ... está aproximadamente en el orden del calculado con el enfoque estándar
- ... se calcula mediante un método matemáticamente sólido
Estos no son requisitos absolutos, pero al menos me gustaría entender por qué mi intuición está equivocada.
Cálculos basados en respuestas existentes.
A continuación, los intervalos de confianza resultantes de las respuestas existentes se comparan para .
Enfoque estándar (también conocido como "Matemáticas escolares")
, , por lo tanto, el intervalo de confianza del 99% es . Esto contradice la intuición 1.[ 0,865 , 1,053 ]
Recorte (sugerido por @soakley en los comentarios)
Simplemente usar el enfoque estándar y proporcionar como resultado es fácil de hacer. ¿Pero se nos permite hacer eso? Todavía no estoy convencido de que el límite inferior se mantenga constante (-> 4.)
Modelo de regresión logística (sugerido por @Rose Hartman)
Datos transformados: Resultando en , transformando de nuevo resulta en . Obviamente, el 6.90 es un valor atípico para los datos transformados, mientras que el 0.99 no es para los datos no transformados, lo que resulta en un intervalo de confianza que es muy grande. (-> 3.)[ 0.173 , 7.87 ] [ 0.543 ,
Intervalo de confianza de proporción binomial (sugerido por @Tim)
El enfoque parece bastante bueno, pero desafortunadamente no se ajusta al experimento. Simplemente combinando los resultados e interpretándolo como un gran experimento repetido de Bernoulli como lo sugiere @ZahavaKor resulta en lo siguiente:
de en total. Alimentando esto en el Adj. La calculadora Wald da . ¡Esto no parece ser realista, porque ni un solo está dentro de ese intervalo! (-> 3.)[ 0.9511 , 0.9657 ] X i
Bootstrapping (sugerido por @soakley)
Con tenemos 3125 posibles permutaciones. Tomando el medio de las permutaciones, obtenemos . El aspecto no que mal, aunque me esperaba un mayor intervalo (-> 3.). Sin embargo, es por construcción nunca mayor que . Por lo tanto, para una muestra pequeña, crecerá en lugar de reducirse para aumentar (-> 2.). Esto es al menos lo que sucede con las muestras dadas anteriormente.3093[0.91,0.99][min(Xi),max(Xi)]n