Realizando un modelo de regresión lineal usando una función de pérdida, ¿por qué debería usar lugar de L 2 regularización?
¿Es mejor prevenir el sobreajuste? ¿Es determinista (por lo que siempre es una solución única)? ¿Es mejor en la selección de características (porque produce modelos dispersos)? ¿Dispersa los pesos entre las características?