Posibilidad de que la muestra de bootstrap sea exactamente la misma que la muestra original

Solo quiero revisar algunos razonamientos.

Si mi muestra original es de tamaño arranco, mi proceso de pensamiento es el siguiente: $n$

$\frac{1}{n}$ es la posibilidad de cualquier observación extraída de la muestra original. Para garantizar que el próximo sorteo no sea la observación muestreada anteriormente, restringimos el tamaño de la muestra a . Por lo tanto, obtenemos este patrón: $n-1$

\frac{1}{norte} \cdot \frac{1}{norte - 1} \cdot \frac{1}{norte - 2} \dots \frac{1}{norte - (norte - 1)} = \frac{1}{norte!} .

$\frac{1}{n} \cdot \frac{1}{n-1} \cdot \frac{1}{n-2} \cdots \frac{1}{n-(n-1)} = \frac{1}{n!}.$

¿Es esto correcto? Me tropiezo con por qué no puede ser lugar. $(\frac{1}{n})^n$

— Jayant.M
fuente

No estoy seguro de seguirte. ¿Por qué quiere "asegurarse de que el próximo sorteo no sea la muestra anterior"? En bootstrapping, la idea es probar con reemplazo. Es decir, que lo quiere que sea posible que el próximo sorteo es el mismo que uno que ya ha dibujado.

— gung - Restablece a Monica

¿Pero eso no significa que la muestra inicial no es la misma que la muestra original?

— Jayant.M

No te sigo No necesariamente desea que la muestra de arranque sea idéntica a su muestra, solo desea tratar la muestra como un modelo de la población.

— gung - Restablece a Monica

Entonces, mi pregunta es cuál es la posibilidad de que la muestra de bootstrap sea la misma que la muestra original. Estoy interesado en que el bootstrap sea idéntico a la muestra

— Jayant

Lo siento si mi pregunta no estaba clara!

— Jayant.M

Tenga en cuenta que en cada posición de observación ( ) podemos elegir cualquiera de las observaciones, por lo que hay posibles vuelve a muestrear (manteniendo el orden en el que se dibujan) de los cuales son la "misma muestra" (es decir, contienen todas las observaciones originales sin repeticiones; esto explica todas las formas de ordenar la muestra con la que comenzamos). $i=1, 2, ..., n$ $n$ $n^n$ $n!$ $n$

Por ejemplo, con tres observaciones, a, byc, tiene 27 muestras posibles:

aaa aab aac aba abb abc aca acb acc 
baa bab bac bba bbb bbc bca bcb bcc 
caa cab cac cba cbb cbc cca ccb ccc

Seis de ellos contienen uno de cada uno de a, by c.

Entonces es la probabilidad de recuperar la muestra original. $n!/n^n$

Aparte: una aproximación rápida de la probabilidad:

Considera eso :

\sqrt{2 π} {norte}^{norte + \frac{1}{2}} {mi}^{- norte} \leq norte! \leq mi {norte}^{norte + \frac{1}{2}} {mi}^{- norte}

${\sqrt {2\pi }}\ n^{n+{\frac {1}{2}}}e^{-n}\leq n!\leq e\ n^{n+{\frac {1}{2}}}e^{-n}$

entonces

\sqrt{2 π} {norte}^{\frac{1}{2}} {mi}^{- norte} \leq norte! / / {norte}^{norte} \leq mi {norte}^{\frac{1}{2}} {mi}^{- norte}

${\sqrt {2\pi }}\ n^{{\frac {1}{2}}}e^{-n}\leq n!/n^n \leq e\ n^{{\frac {1}{2}}}e^{-n}$

Siendo el límite inferior el habitual dado para la aproximación de Stirling (que tiene un error relativo bajo para grande ). $n$

[Gosper ha sugerido usar que daría la aproximación $n! \approx \sqrt{(2n+\frac13)\,\pi}n^ne^{-n}$ para esta probabilidad, que funciona razonablemente bien hasta , o incluso hasta dependiendo de cuán estrictos sean sus criterios.] $\sqrt{(2n+\frac13)\pi}\,e^{-n}$ $n=3$ $n=1$

$(1-\frac{1}{n})^n$ $n$ $e^{-1}$

Para más detalles, consulte
¿Por qué, en promedio, cada muestra de bootstrap contiene aproximadamente dos tercios de las observaciones?

— Glen_b -Reinstate a Monica
fuente

a, b, c

$a,b,c$

a

$a$

Eso ya está cubierto en otras respuestas en el sitio, pero lo he agregado anteriormente (brevemente).

— Glen_b: reinstala a Mónica el

(\frac{1}{n})^{n}

$(\frac {1}{n})^n$

n!

$n!$

n = 1

$n=1$

n = 3

$n=3$

n = 2

$n=2$

n = 1

$n=1$