Sea (tamaño n × p ) un conjunto de entradas estandarizadas, respuestas centradas y (tamaño n × 1 ), pesos de regresión β (tamaño p × 1 ) y coeficiente de penalización de λ > 0 a l 1 .Xn×pyn×1βp×1λ>0l1
β∗L(β,λ)=argminβ L(β,λ)=∥y−Xβ∥22+λ∥β∥1
Resolver esto para todos los valores de produce la llamada ruta de regularización LASSO .β ∗ ( λ )λ>0β∗(λ)
Para un valor fijo del coeficiente de penalización (es decir, número fijo de predictores activos = paso fijo del algoritmo LARS), es posible mostrar que satisface (simplemente escriba la condición de estacionariedad KKT como en este respuesta )λ∗β∗
λ∗=2 sign(β∗a)XTa(y−Xβ∗), ∀a∈A
con representando el conjunto de predictores activos.A
Como debe ser positivo (es un coeficiente de penalización), está claro que el signo de (peso de cualquier predictor activo distinto de cero) debe ser el mismo que el de es decir, la correlación con el residuo de regresión actual.β ∗ a X T a ( y - X β ∗ ) = X T a rλ∗β∗aXTa(y−Xβ∗)=XTar