Deje que sea la agrupación que le interesa; es decir, dejemos que sea una partición de , donde consideramos que hay características . Con la respuesta matriz de diseño , el estimador de lazo de grupo esAplicando otra penalización al cuadrado para inducir una contracción general, obtendríamos el estimadorGG{1,…,p}py∈RnX∈Rn×p
argminβ∈Rp12n∥y−Xβ∥22+λ∑g∈G|G|1/2∥βg∥2.
ℓ2argminβ∈Rp12n∥y−Xβ∥22+λ∑g∈G|G|1/2∥βg∥2+μ∥β∥22.
Podríamos llamar a esto la "red elástica de grupo". Por la dualidad lagrangiana, podemos escribir
argminβ∈Rp=argminβ∈Rp:∥β∥22≤C=argminβ∈Rp:∥β∥2≤C√=argminβ∈Rp=argminβ∈Rp12n∥y−Xβ∥22+λ∑g∈G|G|1/2∥βg∥2+μ∥β∥2212n∥y−Xβ∥22+λ∑g∈G|G|1/2∥βg∥212n∥y−Xβ∥22+λ∑g∈G|G|1/2∥βg∥212n∥y−Xβ∥22+λ∑g∈G|G|1/2∥βg∥2+μ~∥β∥212n∥y−Xβ∥22+(λ∑g∈G|G|1/2∥βg∥2+μ~′p1/2∥β∥2),
donde es la variable dual correspondiente y . Como podemos ver, esta última expresión es un lazo de grupo con grupos "superpuestos", ya que ya no es una partición. Además, el grupo tiene una variable dual (o variable de ajuste) que es distinta de la variable dual para los otros grupos.
μ~μ~′=p−1/2μ~G∪{1,…,p}{1,…,p}μ~λ
Este puede ser un problema de optimización que se puede resolver utilizando el paquete gglasso
. La lectura de la sección en la página 9 de la documentación aquí le informará sobre la gglasso
función, que debe usarse. Tenga en cuenta que el argumento pmax
deberá proporcionarse manualmente con un último componente que servirá como parámetro de ajuste.