Además de las respuestas ya publicadas (¡que me han sido muy útiles!), Hay una explicación geométrica de la conexión entre la norma L2 y la media.
Para usar la misma notación que chefwen , la fórmula para la pérdida de L2 es:
L 2 = 1k∑i = 1k( yyo- β)2
Deseamos encontrar el valor de que minimiza . Tenga en cuenta que esto es equivalente a minimizar lo siguiente, ya que multiplicar por y tomar la raíz cuadrada conservan el orden:L 2 kβL 2k
∑i = 1k( yyo- β)2----------⎷
Si considera el vector de datos como un punto en el espacio -dimensional, esta fórmula calcula la distancia euclidiana entre el punto el punto .ykyβ⃗ = ( β, β, . . . , β)
Entonces, el problema es encontrar el valor que minimiza la distancia euclidiana entre los puntos y . Dado que todos los valores posibles de encuentran en la línea paralela a por definición, esto es equivalente a encontrar la proyección vectorial de sobre .βyβ⃗ β⃗ 1⃗ = ( 1 , 1 , . . . , 1 )y1⃗
Solo es realmente posible visualizar esto cuando , pero aquí hay un ejemplo donde . Como se muestra, proyectar en produce como esperamos.k = 2y= ( 2 , 6 )1⃗ ( 4 , 4 )
Para mostrar que esta proyección siempre produce la media (incluso cuando ), podemos aplicar la fórmula para la proyección :k > 2
β⃗ β= proyecto1⃗ y= y⋅ 1⃗ El | 1⃗ El |21⃗ = ∑ki =1yyok