Parece que estoy malentendido una afirmación sobre los métodos de regresión lineal que he visto en varios lugares. Los parámetros del problema son:
Entrada:
muestras de datos de cantidades de , cada una de las cuales consiste en una cantidad de "respuesta" y p cantidades de "predictor" x_ {ij}
El resultado deseado es un "buen ajuste lineal" que predice la respuesta en función de los predictores donde un buen ajuste tiene pequeñas diferencias entre la predicción y la respuesta observada (entre otros criterios).
Salida: coeficientes donde es un "buen ajuste" para predecir la cantidad de respuesta a partir de las cantidades de predictores.
Estoy confundido sobre el enfoque de "regresión de cresta" para este problema. En "Los elementos del aprendizaje estadístico" de Hastie, Tibshirani y Friedman, página 63, la regresión de la cresta se formula de dos maneras.
Primero como el problema de optimización restringida :
El segundo es el problema de optimización penalizado : para algún parámetro positivo .
El texto dice que estas formulaciones son equivalentes y que existe una "correspondencia uno a uno entre los parámetros y ". He visto este reclamo (y otros similares) en varios lugares además de este libro. Creo que me estoy perdiendo algo porque no entiendo cómo las formulaciones son equivalentes según lo entiendo.
Considere el caso donde y con , e , . Al elegir el parámetro la formulación restringida se convierte en:
expandido a
Para resolver esto, encuentre la solución donde las derivadas parciales con respecto a y son cero: con la solución y . Tenga en cuenta que según sea necesario.
¿Cómo se relaciona esta derivación con la otra formulación? De acuerdo con la explicación, hay un valor de corresponde únicamente a donde, si optimizamos la formulación penalizada del problema, obtendremos los mismos y . En este caso, la forma penalizada se convierte en expandido a Para resolver esto, encuentra la solución donde las derivadas parciales con respecto a
En resumen, estoy totalmente confundido por las dos presentaciones y no entiendo cómo se corresponden entre sí. No entiendo cómo puede optimizar un formulario y obtener la misma solución para el otro formulario o cómo está relacionado con . Esta es solo una instancia de este tipo de correspondencia, hay otras para otros enfoques como el lazo, y no entiendo ninguna de ellas.
Que alguien me ayude por favor.