Una vez que obtenga una dirección de descenso para su función objetivo f ( x ) , debe elegir una longitud de paso "buena". No desea dar un paso que sea demasiado grande para que la función en su nuevo punto sea más grande que su punto actual. Al mismo tiempo, no desea hacer que su paso sea demasiado pequeño, de modo que se necesite una eternidad para converger.pf(x)
La condición de Armijo básicamente sugiere que una longitud de paso "buena" es tal que tiene una "disminución suficiente" en en su nuevo punto. La condición se establece matemáticamente como f ( x k + α p k ) ≤ f ( x k ) + β α ∇ f ( x k ) T p k donde p k es una dirección de descenso en x k y β ∈ ( 0 , 1 ) . f
f(xk+αpk)≤f(xk)+βα∇f(xk)Tpk
pkxkβ∈(0,1)
La intuición detrás de esto es que el valor de la función en el nuevo punto debe estar debajo de la "línea tangente" reducida en x k en la dirección de p k . Ver el libro de Nocedal & Wright "Optimización numérica". En el capítulo 3, hay una excelente descripción gráfica de la condición de disminución suficiente de armijo.f(xk+αpk)xkpk