¿Por qué el “lazo relajado” es diferente del lazo estándar?


16

Si comenzamos con un conjunto de datos , le aplicamos Lasso y obtenemos una solución β L , podemos volver a aplicar Lasso al conjunto de datos ( X S , Y ) , donde S es el conjunto de valores distintos de cero. índices de β L , para obtener una solución, β R L , llamada solución 'LASSO relajada' (¡corríjame si me equivoco!). La solución β L debe satisfacer las condiciones de Karush – Kuhn – Tucker (KKT) para ( X , Y )(X,Y)βL(XS,Y)SβLβRLβL(X,Y)pero, dada la forma de las condiciones KKT para , ¿no las satisface también? Si es así, ¿qué sentido tiene hacer LASSO por segunda vez?(XS,Y)

Esta pregunta es un seguimiento de: ¿ Ventajas de hacer "doble lazo" o realizar el lazo dos veces?

Respuestas:


10

De la definición 1 de Meinshausen (2007) , hay dos parámetros que controlan la solución del lazo relajado.

λϕϕ=1ϕ<1

Esta formulación en realidad corresponde a resolver dos problemas:

  1. λ
  2. XS, cual es X reducido a variables seleccionadas por 1, con un parámetro de penalización λϕ.
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.