El umbral se elige de modo que asegure la convergencia de la distribución hipergeométrica ( es su SD), en lugar de una distribución binomial (para muestreo con reemplazo), a una distribución normal ( este es el Teorema del límite central, ver, por ejemplo, La curva normal, el Teorema del límite central y las Desigualdades de Markov y Chebychev para variables aleatorias ). En otras palabras, cuando (es decir, no es 'demasiado grande' en comparación con ), el FPC puede ignorarse con seguridad; es fácil ver cómo evoluciona el factor de corrección con variable para un fijo : con , tenemosnorte- nnorte- 1----√n N n N N = 10 , 000 FPC = .9995n / N≤ 0.05nortenortenortenortenorte= 10 , 000FPC = .9995 cuando mientras cuando . Cuando , el FPC se acerca a 1 y estamos cerca de la situación de muestreo con reemplazo (es decir, como con una población infinita).FPC = .3162 n = 9 , 000 N → ∞n = 10FPC = .3162n = 9 , 000norte→ ∞
Para comprender estos resultados, un buen punto de partida es leer algunos tutoriales en línea sobre la teoría de muestreo donde el muestreo se realiza sin reemplazo ( muestreo aleatorio simple ). Este tutorial en línea sobre estadísticas no paramétricas tiene una ilustración sobre cómo calcular la expectativa y la varianza para un total.
Notarás que algunos autores usan lugar de en el denominador del FPC; de hecho, depende de si trabaja con la estadística de muestra o población: para la varianza, será lugar de si está interesado en lugar de .N - 1 N N - 1 S 2 σ 2nortenorte- 1nortenorte- 1S2σ2
En cuanto a las referencias en línea, puedo sugerirle