Esta publicación sigue a esta: ¿Por qué la estimación de cresta se vuelve mejor que OLS al agregar una constante a la diagonal?
Aquí está mi pregunta:
Hasta donde yo sé, la regularización de crestas utiliza una -norm (distancia euclidiana). Pero, ¿por qué usamos el cuadrado de esta norma? (una aplicación directa de resultaría con la raíz cuadrada de la suma de beta al cuadrado).
Como comparación, no hacemos esto para LASSO, que usa una -norm para regularizar. Pero aquí es la norma "real" (solo la suma del cuadrado de los valores absolutos beta, y no el cuadrado de esta suma).
¿Alguien puede ayudarme a aclarar?