Por lo general, no puede descomponer el error (residuos) en componentes de sesgo y varianza. La razón simple es que generalmente no conoce la verdadera función. Recordemos que y que f ( x )b i a s ( f^( x ) ) = E[ f^( x ) - f( x ) ] ,F( x ) es la cosa desconocida desea estimar.
¿Qué pasa con bootstrapping?
Es posible estimar el sesgo de un estimador de arranque, pero no se trata de modelos de embolsado, y no creo que hay una manera de utilizar el sistema de arranque para evaluar el sesgo en f ( x ) , porque se basa todavía bootstrapping en alguna noción de la Verdad y no puede, a pesar de los orígenes de su nombre, crear algo de la nada.F^( X ) ,
Para aclarar: la estimación bootstrap de sesgo en el estimador θ es
^ b i un sθ^
b i a sˆsi= θ^∗( ⋅ ) - θ^,
con siendo la media de la estadística calculada sobreBmuestras de arranque. Este proceso emula el de muestreo de alguna población y el cálculo de su cantidad de interés. Esto sólo funciona si θθ^∗( ⋅ )si θ^ podría, en principio, ser calculado directamente de la población. La estimación de inicialización del sesgo evalúa si la estimación del complemento, es decir, simplemente haciendo el mismo cálculo en una muestra en lugar de en la población, está sesgada.
Si solo desea utilizar sus residuos para evaluar el ajuste del modelo, eso es completamente posible. Si usted, como dice en los comentarios, desea comparar los modelos anidados y f 2 ( x ) = 3 x 1 + 2 x 2 + x 1 x 2 , usted puede hacer ANOVA para verificar si el modelo más grande reduce significativamente la suma del error al cuadrado.F1(x ) = 3 x1+ 2 x2F2( x ) = 3 x1+ 2 x2+ x1X2