Si no recuerdo mal, el ADMM a menudo se establece como un algoritmo para resolver
para dos convexos , inferior-semicontinuos funcionales y y lineales, operadores delimitadas y .F G A B
minx,y F(x)+G(y),s.tAx+By=c
FGAB
Encuentro el siguiente caso especial de , y ilustrativo. En este caso, la restricción dice , es decir, podemos sustituir para obtener el problema
Ahora resolver esto puede ser difícil, mientras que resolver problemas de la forma
puede ser fácil. (Puede crear ejemplos para esto usted mismo, uno popular es y ). En ADMM comienzas desde la "forma "
y construyes el "lagragiano aumentado"
A=IB=−Ic=0x - y= 0
minXF( x ) + G ( x ) .
F(x)=λ‖x‖1minXρ F( x ) + 12∥ x - z∥2
F( x ) = λ ∥ x ∥1minx,yF(x)+G(y),G ( x ) = 12∥ A x - b ∥2L ρ ( x , y , z ) = F ( x ) + G ( y ) + z T ( x - y ) + ρminx , y F( x ) + G ( y) ,S tx - y= 0
zxyxk+1=argminxLρ(x,yk,zk)yk+1=argminyLρ(xk+1,y,z)zk+1Lρ( x , y, z) = F( x ) + G ( y) + zT( x - y) + ρ2∥ x - y∥2
con el
multiplicador de Lagrange . Ahora minimiza
alternativamente el Lagragio augementado en las diferentes
direcciones e , es decir, itera
y actualiza el multiplicador de acuerdo con
Esto debería explicar el nombre del
método de direcciones alternas de multiplicadores .
z XyXk + 1= a r g m i nX Lρ( x , yk, zk)
yk + 1= a r g m i ny Lρ( xk + 1, y, z)
zk + 1= zk+ ρ ( xk + 1- yk + 1) .
El análisis de estos problemas de minimización de e más cerca, se observa que para cada actualización sólo se necesita para resolver un problema de la "forma más simple", por ejemplo, para la actualización
(descuidando los términos que no dependen de ).y x x k + 1 = a r g m i n x F ( x ) + ρXyXx
Xk + 1= a r g m i nX F( x ) + ρ2∥ x - yk+ ρ zk∥2
X
ADMM para el problema
se deriva de manera similar, pero los problemas intermedios para las actualizaciones siguen siendo una poco difícil pero puede ser comparativamente simple en comparación con el original. Especialmente en el caso de y (o equivalente , y la restricción ) las actualizaciones son más o menos fáciles de implementar.F ( x ) = λ ‖ x ‖ 1 G ( x ) = 1
minx,y F(x)+G(y),s.tAx+By=c
F(x)=λ∥x∥1F(x)=λ‖x‖1G(y)=1G(x)=12∥Ax−b∥2F(x)=λ∥x∥1Ax-y=bG(y)=12∥y∥2Ax−y=b