Explicación del factor de corrección finito.

Entiendo que cuando se toma una muestra de una población finita y nuestro tamaño de muestra es más del 5% de la población, necesitamos una corrección en la media y el error estándar de la muestra usando esta fórmula:

$\hspace{10mm} FPC=\sqrt{\frac{N-n}{N-1}}$

Donde es el tamaño de la población es el tamaño de la muestra. $N$ $n$

Tengo 3 preguntas sobre esta fórmula:

¿Por qué el umbral se establece en 5%?
¿Cómo se derivó la fórmula?
¿Existen otros recursos en línea que expliquen exhaustivamente esta fórmula además de este documento?

sampling finite-population

— Sara
fuente

¡No corriges la media!

— whuber

Solo corrige la varianza.

— SmallChess

El umbral se elige de modo que asegure la convergencia de la distribución hipergeométrica ( es su SD), en lugar de una distribución binomial (para muestreo con reemplazo), a una distribución normal ( este es el Teorema del límite central, ver, por ejemplo, La curva normal, el Teorema del límite central y las Desigualdades de Markov y Chebychev para variables aleatorias ). En otras palabras, cuando (es decir, no es 'demasiado grande' en comparación con ), el FPC puede ignorarse con seguridad; es fácil ver cómo evoluciona el factor de corrección con variable para un fijo : con , tenemos $\sqrt{\frac{N-n}{N-1}}$ $n/N\leq 0.05$ $n$ $N$ $n$ $N$ $N=10,000$ $\text{FPC}=.9995$ cuando mientras cuando . Cuando , el FPC se acerca a 1 y estamos cerca de la situación de muestreo con reemplazo (es decir, como con una población infinita). $n=10$ $\text{FPC}=.3162$ $n=9,000$ $N\to\infty$

Para comprender estos resultados, un buen punto de partida es leer algunos tutoriales en línea sobre la teoría de muestreo donde el muestreo se realiza sin reemplazo ( muestreo aleatorio simple ). Este tutorial en línea sobre estadísticas no paramétricas tiene una ilustración sobre cómo calcular la expectativa y la varianza para un total.

Notarás que algunos autores usan lugar de en el denominador del FPC; de hecho, depende de si trabaja con la estadística de muestra o población: para la varianza, será lugar de si está interesado en lugar de . $N$ $N-1$ $N$ $N-1$ $S^2$ $\sigma^2$

En cuanto a las referencias en línea, puedo sugerirle

— chl
fuente

Esta fórmula se usa para población finita, pero con reemplazo o sin reemplazo.

— skan

@skan sin reemplazo.

— Black Milk