Supongamos que uno realiza la llamada rutina de arranque no paramétrica extrayendo muestras de tamaño cada una de las observaciones originales con reemplazo. Creo que este procedimiento es equivalente a estimar la función de distribución acumulativa por el cdf empírico:
http://en.wikipedia.org/wiki/Empirical_distribution_function
y luego obtener las muestras de bootstrap simulando observaciones del cdf estimado en una fila.
Si tengo razón en esto, entonces uno tiene que abordar el tema del sobreajuste, porque el cdf empírico tiene aproximadamente N parámetros. Por supuesto, asintóticamente converge al cdf de la población, pero ¿qué pasa con las muestras finitas? Por ejemplo, si le dijera que tengo 100 observaciones y voy a estimar el cdf como con dos parámetros, no se alarmaría. Sin embargo, si el número de parámetros fuera a 100, no parecería razonable en absoluto.
Del mismo modo, cuando uno emplea una regresión lineal múltiple estándar, la distribución del término de error se estima como . Si uno decide cambiar a bootstrapping los residuales, debe darse cuenta de que ahora se usan aproximadamente parámetros solo para manejar la distribución del término de error.
¿Podría dirigirme a algunas fuentes que aborden este problema explícitamente o decirme por qué no es un problema si cree que me equivoqué?