No utilice la aproximación normal.
Mucho se ha escrito sobre este problema. Un consejo general es nunca usar la aproximación normal (es decir, el intervalo de confianza asintótico / de Wald), ya que tiene propiedades de cobertura terribles. Código R para ilustrar esto:
library(binom)
p = seq(0,1,.001)
coverage = binom.coverage(p, 25, method="asymptotic")$coverage
plot(p, coverage, type="l")
binom.confint(0,25)
abline(h=.95, col="red")
Para probabilidades de éxito pequeñas, puede pedir un intervalo de confianza del 95%, ¡pero en realidad obtener, digamos, un intervalo de confianza del 10%!
Recomendaciones
Entonces, ¿ qué debemos usar? Creo que las recomendaciones actuales son las que figuran en la estimación de intervalo de papel para una proporción binomial de Brown, Cai y DasGupta en Statistical Science 2001, vol. 16, no. 2, páginas 101–133. Los autores examinaron varios métodos para calcular los intervalos de confianza y llegaron a la siguiente conclusión.
[Recomendamos] el intervalo de Wilson o el intervalo anterior de Jeffreys de cola igual para n pequeña y el intervalo sugerido en Agresti y Coull para n más grande .
El intervalo de Wilson también se llama a veces intervalo de puntuación , ya que se basa en invertir una prueba de puntuación.
Calculando los intervalos
Para calcular estos intervalos de confianza, puede usar esta calculadora en línea o la binom.confint()
función en el binom
paquete en R. Por ejemplo, para 0 éxitos en 25 ensayos, el código R sería:
> binom.confint(0, 25, method=c("wilson", "bayes", "agresti-coull"),
type="central")
method x n mean lower upper
1 agresti-coull 0 25 0.000 -0.024 0.158
2 bayes 0 25 0.019 0.000 0.073
3 wilson 0 25 0.000 0.000 0.133
Aquí bayes
está el intervalo de Jeffreys. (El argumento type="central"
es necesario para obtener el intervalo de igual cola ).
Tenga en cuenta que debe decidir cuál de los tres métodos desea utilizar antes de calcular el intervalo. Mirar los tres y seleccionar el más corto naturalmente le dará una probabilidad de cobertura demasiado pequeña.
Una respuesta rápida y aproximada.
Como nota final, si observa exactamente cero éxitos en sus n pruebas y solo desea un intervalo de confianza aproximado muy rápido, puede usar la regla de tres . Simplemente divide el número 3 por n . En el ejemplo anterior, n es 25, entonces el límite superior es 3/25 = 0.12 (el límite inferior es, por supuesto, 0).