En el libro de Goodfellow (2016) sobre aprendizaje profundo, habló sobre la equivalencia de la parada temprana a la regularización L2 ( https://www.deeplearningbook.org/contents/regularization.html página 247).
La aproximación cuadrática de la función de costo viene dada por:
donde es la matriz de Hesse (Ec. 7.33). ¿Falta esto el término medio? La expansión de Taylor debe ser: