Esta pregunta ha sido provocada por algo que leí en este libro de texto de estadísticas de nivel de posgrado y que también escuché (independientemente) durante esta presentación en un seminario estadístico. En ambos casos, la declaración estaba en la línea de "debido a que el tamaño de la muestra es bastante pequeño, decidimos realizar una estimación mediante bootstrap en lugar de (o junto con) este método paramétrico ".
No consiguieron en los detalles, pero probablemente el razonamiento fue el siguiente: Método supone que los datos se ajustan a una determinada distribución paramétrica D . En realidad, la distribución no es exactamente D , pero está bien siempre que el tamaño de la muestra sea lo suficientemente grande. Dado que en este caso el tamaño de la muestra es demasiado pequeño, cambiemos al bootstrap (no paramétrico) que no hace suposiciones de distribución. ¡Problema resuelto!
En mi opinión, para eso no es para bootstrap. Así es como lo veo: bootstrap puede darle una ventaja cuando es más o menos obvio que hay suficientes datos, pero no hay una solución de forma cerrada para obtener errores estándar, valores p y estadísticas similares. Un ejemplo clásico es obtener un IC para el coeficiente de correlación dada una muestra de una distribución normal bivariada: la solución de forma cerrada existe, pero es tan complicada que el arranque es más simple. Sin embargo, nada implica que bootstrap de alguna manera pueda ayudar a alguien a salirse con una muestra pequeña.
¿Es correcta mi percepción?
Si encuentra esta pregunta interesante, hay otra pregunta de arranque más específica de mi parte:
Bootstrap: la cuestión del sobreajuste
PD: No puedo evitar compartir un ejemplo atroz del "enfoque de arranque". No estoy revelando el nombre del autor, pero es uno de los "cuantos" de la generación anterior que escribió un libro sobre Finanzas Cuantitativas en 2004. El ejemplo se toma de allí.
Considere el siguiente problema: suponga que tiene 4 activos y 120 observaciones de retorno mensual para cada uno. El objetivo es construir el cdf 4-dimensional conjunto de rendimientos anuales. Incluso para un solo activo, la tarea parece difícilmente alcanzable con solo 10 observaciones anuales, y mucho menos la estimación de cdf 4-dimensional. Pero no se preocupe, el "bootstrap" lo ayudará: tome todas las observaciones 4-dimensionales disponibles, muestree 12 con reemplazo y compárelas para construir un solo vector 4-bootstrap "de retorno anual". Repita eso 1000 veces y, he aquí, se obtuvo una "muestra de arranque" de 1000 declaraciones anuales. Use esto como una muestra iid de tamaño 1000 con el propósito de estimar cdf, o cualquier otra inferencia que pueda extraerse de un historial de mil años.