Considere la regresión lineal con cierta regularización: Ej. Encuentre que minimice| El | A x - b | El | 2 + λ | El | x | El | 1
Por lo general, las columnas de A están estandarizadas para tener una media cero y una norma unitaria, mientras que se centra para tener una media cero. Quiero asegurarme de que mi comprensión de la razón para estandarizar y centrar sea correcta.
Al hacer que las medias de las columnas de y cero, ya no necesitamos un término de intercepción. De lo contrario, el objetivo habría sido . Al hacer que las normas de las columnas de A sean iguales a 1, eliminamos la posibilidad de un caso donde solo porque una columna de A tiene una norma muy alta, obtiene un coeficiente bajo en , lo que podría llevarnos a concluir incorrectamente que esa columna de A no "explica" bien.
Este razonamiento no es exactamente riguroso sino intuitivamente, ¿es esa la forma correcta de pensar?
$x$ does not ''explain'' $A$ well
y decirx does not ''explain'' $A$ at all
? son los datos, mientras que x es el modelo en este caso.