Estoy luchando por comprender la derivación del error de predicción esperado a continuación (ESL), especialmente en la derivación de 2.11 y 2.12 (condicionamiento, el paso hacia el mínimo puntual). Cualquier puntero o enlace muy apreciado.
A continuación estoy informando el extracto de ESL pág. 18. Las dos primeras ecuaciones son, en orden, las ecuaciones 2.11 y 2.12.
Supongamos que denota un vector de entrada aleatorio con valor real, e una variable de salida aleatoria con valor real, con distribución conjunta . Buscamos una función para predecir valores dados de la entrada . Esta teoría requiere una función de pérdida para penalizar los errores en la predicción, y con mucho, el más común y conveniente es la pérdida de error al cuadrado : . Esto nos lleva a un criterio para elegir ,
El error de predicción esperado (al cuadrado). Al condicionar en , podemos escribir EPE como
y vemos que es suficiente minimizar EPE puntualmente:
La solucion es
La expectativa condicional, también conocida como la función de regresión .