Hay varias formas en que uno puede aplicar el bootstrap. Los dos enfoques más básicos son lo que se considera el bootstrap "no paramétrico" y "paramétrico". El segundo supone que el modelo que está utilizando es (esencialmente) correcto.
Centrémonos en el primero. Asumiremos que tiene una muestra aleatoria distribuida de acuerdo con la función de distribuciónX1, X2, ... , Xnorte . (Suponiendo que de otro modo requiere enfoques modificados.) Sea F n ( x ) = n - 1 Σ n i = 1 1 ( X i ≤ x ) será la función de distribución acumulativa empírica. Gran parte de la motivación para el arranque proviene de un par de hechos.FF^norte( x ) = n- 1∑nortei = 11 ( Xyo≤ x )
Desigualdad Dvoretzky – Kiefer – Wolfowitz
P ( supx ∈ REl | F^norte( x ) - F( x ) | > ε ) ≤ 2 e- 2 n ε2.
Lo que esto muestra es que la función de distribución empírica converge uniformemente con la función de distribución verdadera exponencialmente rápida en probabilidad. De hecho, esta desigualdad junto con el lema de Borel-Cantelli muestra de inmediato que casi seguro.cenarx ∈ REl | F^norte( x ) - F( x ) | → 0
No hay condiciones adicionales en la forma de para garantizar esta convergencia.F
Heurísticamente, entonces, si estamos interesados en alguna de la función de distribución que sea suave , entonces esperamos que esté cerca de .T ( F n ) T ( F )T( F)T( F^norte)T( F)
(Puntiagudo) imparcialidad deF^norte( x )
Por simple linealidad de expectativa y la definición de , para cada ,x∈RF^norte( x )x ∈ R
miFF^norte( x ) = F( x ).
Supongamos que estamos interesados en la media . Entonces, la imparcialidad de la medida empírica se extiende a la imparcialidad de los funcionales lineales de la medida empírica. Entonces,
E F T ( F n ) = E F ˉ X n = μ = T ( F )μ = T( F)
miFT( F^norte) = EFX¯norte= μ = T( F).
Entonces es correcto en promedio y dado que se acerca rápidamente a , entonces (heurísticamente), se acerca rápidamente a .^ F n F T ( F n ) T ( F )T( F^norte)Fnorte^FT( F^norte)T( F)
Para construir un intervalo de confianza ( que es, esencialmente, de qué se trata el bootstrap ), podemos usar el teorema del límite central, la consistencia de los cuantiles empíricos y el método delta como herramientas para pasar de funciones lineales simples a estadísticas de interés más complicadas. .
Buenas referencias son
- B. Efron, métodos Bootstrap: Otra mirada a la navaja , Ann. Stat. vol. 7, no. 1, 1–26.
- B. Efron y R. Tibshirani, Introducción a Bootstrap , Chapman – Hall, 1994.
- GA Young y RL Smith, Fundamentos de la inferencia estadística , Cambridge University Press, 2005, Capítulo 11 .
- AW van der Vaart, Estadísticas asintóticas , Cambridge University Press, 1998, Capítulo 23 .
- P. Bickel y D. Freedman, Alguna teoría asintótica para el bootstrap . Ana. Stat. vol. 9, no. 6 (1981), 1196-1217.