Tenga en cuenta que en cada posición de observación ( ) podemos elegir cualquiera de las n observaciones, por lo que hay n n posibles vuelve a muestrear (manteniendo el orden en el que se dibujan) de los cuales n ! son la "misma muestra" (es decir, contienen todas las n observaciones originales sin repeticiones; esto explica todas las formas de ordenar la muestra con la que comenzamos).i = 1 , 2 , . . . , nnortenortenorten !norte
Por ejemplo, con tres observaciones, a, byc, tiene 27 muestras posibles:
aaa aab aac aba abb abc aca acb acc
baa bab bac bba bbb bbc bca bcb bcc
caa cab cac cba cbb cbc cca ccb ccc
Seis de ellos contienen uno de cada uno de a, by c.
Entonces es la probabilidad de recuperar la muestra original.n ! / nnorte
Aparte: una aproximación rápida de la probabilidad:
Considera eso :
2 π--√ norten + 12mi- n≤ n ! ≤ e n n + 12mi- n
entonces
2 π--√ norte12mi- n≤ n ! / nnorte≤ e n 12mi- n
Siendo el límite inferior el habitual dado para la aproximación de Stirling (que tiene un error relativo bajo para grande ).norte
[Gosper ha sugerido usar que daría la aproximación √n ! ≈ ( 2 n + 13)π---------√nortenortemi- n para esta probabilidad, que funciona razonablemente bien hasta n = 3 , o incluso hasta n = 1 dependiendo de cuán estrictos sean sus criterios.]( 2 n + 13) π--------√mi- nn = 3n = 1
( 1 - 1norte)nortenortemi- 1
Para más detalles, consulte
¿Por qué, en promedio, cada muestra de bootstrap contiene aproximadamente dos tercios de las observaciones?