Considere una muestra de números reales. Digamos que queremos estimar la tendencia central de la población y tener una idea de nuestra incertidumbre en torno a esta estimación.
Pongamos a un lado las suposiciones sobre la distribución de la población por un momento, y consideremos los siguientes dos enfoques.
- Obtenga una muestra de bootstrap de la muestra de entrada. Es decir, muestrear con reemplazo (p. Ej., Obtener 100 muestras) y calcular la media de cada muestra. Luego sacamos la media y los intervalos de confianza en la distribución empírica resultante de las medias.
- Generamos la media de la muestra de entrada y los percentiles alrededor de la media para transmitir incertidumbre alrededor de la estimación.
Bootstrap vs muestra original:
- Si bien entiendo qué enfoque # 1 hace. ¿Hay un estimador subyacente detrás del # 2?
- ¿Qué transmitirían los percentiles alrededor de la media en el n. ° 2 en contraste con el IC del n. ° 1? El enfoque n. ° 2 transmite una sensación de incertidumbre, pero me resulta difícil relacionarlo con una interpretación bayesiana o frecuentista.
- ¿Proporcionaría alguna vez el método # 2 un mejor estimador de la media de la población? (por ejemplo, menos sesgada y menor varianza)?