Clopper-Pearson para no matemáticos


12

Me preguntaba si alguien puede explicarme la intuición más allá del CI Clopper-Pearson para las proporciones.

Hasta donde yo sé, cada CI incluye una variación en él. Sin embargo, para las proporciones, incluso si mi proporción es 0 o 1 (0% o 100%), se puede calcular el IC de Clopper-Pearson. Intenté mirar las fórmulas, y entiendo que tiene algo con percentiles de la distribución binomial y entiendo que encontrar el IC implica iteraciones, pero me preguntaba si alguien puede explicar la lógica y racional en "palabras simples", o con un mínimo de matemáticas ?

Respuestas:


22

Cuando dice que está acostumbrado a los intervalos de confianza que contienen una expresión para la varianza, está pensando en el caso gaussiano, en el que la muestra resume la información sobre los dos parámetros que caracterizan a la población, uno su media y otro su varianza. media y varianza muestral. La media muestral estima la media poblacional, pero la precisión con la que lo hace depende de la varianza de la población, estimada a su vez por la varianza de la muestra. La distribución binomial, por otro lado, tiene un solo parámetro, la probabilidad de éxito en cada ensayo individual, y toda la información dada por la muestra sobre este parámetro se resume en el no total. éxitos de tantos ensayos independientes. La varianza de la población y la media están determinadas por este parámetro.

πxn

Pr(X=x)=(nx)πx(1π)nx

Aumente hasta que la probabilidad de o menos éxitos caiga al 2.5%: ese es su límite superior. Disminuya hasta que la probabilidad de o más éxitos caiga a 2.5%: ese es su límite inferior. (Sugiero que realmente intentes hacer esto si no está claro al leerlo). Lo que estás haciendo aquí es encontrar los valores de que, tomados como una hipótesis nula, podrían ser rechazados por un (solo) prueba de dos colas a un nivel de significancia del 5%. A la larga, los límites calculados de esta manera cubren el verdadero valor de , sea lo que sea, al menos el 95% del tiempo.πxπxππ


+1. Esto podría merecer una pregunta por sí solo, pero rápidamente preguntaré aquí: para una aplicación particular, me gustaría obtener una medida de incertidumbre única (algo que se comporta como un error estándar de la media) para varias proporciones. Sé que hay varios procedimientos de CI binomial, incluido Clopper-Pearson. ¿Tendría sentido tomar un ancho de un IC como medida de incertidumbre? O quizás ancho / 1.96 / 2 para que produzca exactamente SEM en el límite gaussiano.
ameba dice Reinstate Monica

1
@amoeba: Presumiblemente estás pensando en tamaños de muestra pequeños: (1) Probablemente quieras algo como CI de Blaker-Spjotvoll en lugar de CI basados ​​en una prueba de área de cola igual. (2) La distribución de confianza es bastante irregular, lo que haría que el ancho de cualquier intervalo sea desagradablemente sensible a la cobertura que estipulas.
Scortchi - Restablece a Monica
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.