El hiperplano óptimo en SVM se define como:
donde representa el umbral. Si tenemos algún mapeo que mapea el espacio de entrada a algún espacio , podemos definir SVM en el espacio , donde el hiperplano óptimo será:ϕ Z Z
Sin embargo, siempre podemos definir el mapeo para que , , y luego el hiperplano óptimo se definirá como ϕ 0 ( x ) = 1 ∀ x w ⋅ ϕ ( x ) = 0.
Preguntas:
¿Por qué muchos documentos usan cuando ya tienen mapeo y estiman los parámetros y theshold separado?ϕ w b
¿Hay algún problema para definir SVM como s.t. \ y_n \ mathbf w \ cdot \ mathbf \ phi (\ mathbf x_n) \ geq 1, \ forall n y estimamos solo el vector de parámetros \ mathbf w , suponiendo que definamos \ phi_0 (\ mathbf x) = 1, \ forall \ mathbf x ?
Si es posible la definición de SVM de la pregunta 2., tendremos y el umbral será simplemente , que no trataremos por separado. Por lo tanto, nunca usaremos fórmulas como para estimar partir de algún vector de soporte . ¿Derecho?