La gente dice que el margen suave SVM utiliza la función de pérdida de bisagra: . Sin embargo, la función objetivo real que SVM de margen blando intenta minimizar es \ frac {1} {2} \ | w \ | ^ 2 + C \ sum_i \ max (0,1-y_i (w ^ \ intercal x_i + b) ) Algunos autores llaman al regularizador de término \ | w \ | ^ 2 y la función de pérdida de término \ max (0,1-y_i (w ^ \ intercal x_i + b)) .
Sin embargo, para SVM de margen duro, toda la función objetivo es solo
Bueno, si es la función de pérdida en este caso, ¿podemos llamarla función de pérdida cuadrática? Si es así, ¿por qué la función de pérdida de SVM de margen duro se convierte en regularizador en SVM de margen blando y hace un cambio de pérdida cuadrática a pérdida de bisagra?