Deje que represente su espacio de entrada, es decir, el espacio donde residen sus puntos de datos. Considere una función tal que tome un punto de su espacio de entrada y lo asigne a un punto en . Ahora, digamos que hemos asignado todos sus puntos de datos desde a este nuevo espacio . Ahora, si intenta resolver el svm lineal normal en este nuevo espacio lugar de , notará que todo el trabajo anterior simplemente se ve igual, excepto que todos los puntos están representados comoXΦ : X→ FXFXFFXXyoΦ (Xyo)y en lugar de usar (producto de puntos) que es el producto interno natural para el espacio euclidiano, lo reemplazamos con que representa el producto interno natural en el nuevo espacio . Entonces, al final, tu se vería así,XTy⟨ Φ ( x ) , Φ ( y) ⟩Fw∗
w∗=∑i ∈ SVhyoyyoΦ (Xyo)
y por lo tanto,
⟨w∗, Φ ( x ) ⟩ =∑i ∈ SVhyoyyo⟨ Phi (Xyo) , Φ ( x ) ⟩
Del mismo modo,
si∗=1El | SVEl |∑i ∈ SV(yyo-∑j = 1norte(hjyj⟨ Phi (Xj) , Φ (Xyo) ⟩ ) )
y su regla de clasificación se ve así: .CX= Signo ( ⟨ w , Φ ( x ) ⟩ + b )
Hasta ahora todo bien, no hay nada nuevo, ya que simplemente hemos aplicado el SVM lineal normal a un espacio diferente. Sin embargo, la parte mágica es esta:
Digamos que existe una función tal que . Luego, podemos reemplazar todos los productos de puntos anteriores con . Tal se llama función del núcleo.k : X× X→ Rk (Xyo,Xj) = ⟨ Phi (Xyo) , Φ (Xj) ⟩k (Xyo,Xj)k
Por lo tanto, su y parecen,
w∗si∗
⟨w∗, Φ ( x ) ⟩ =∑i ∈ SVhyoyyok (Xyo, x )
si∗=1El | SVEl |∑i ∈ SV(yyo-∑j = 1norte(hjyjk (Xj,Xyo) ) )
¿Para qué funciones del núcleo es válida la sustitución anterior? Bueno, esa es una pregunta un poco complicada y es posible que desee tomar material de lectura adecuado para comprender esas implicaciones. Sin embargo, solo agregaré que lo anterior es válido para RBF Kernel.
Para responder a su pregunta, "¿Es la situación para que todos los vectores de soporte sean necesarios para la clasificación?" Si. Como puede observar anteriormente, calculamos el producto interno de con lugar de calcular explícitamente. Esto requiere que retengamos todos los vectores de soporte para la clasificación.wXw
Nota: Las en la sección final aquí son la solución a la dual del SVM en el espacio y no . ¿Eso significa que necesitamos saber explícitamente la función ? Por suerte no. Si observa el doble objetivo, consiste solo en un producto interno y dado que tenemos que nos permite calcular el producto interno directamente, no necesitamos saber explícitamente. El objetivo dual simplemente se ve como
hyoFXΦkΦ
max∑yohyo-∑i , jyyoyjhyohjk (Xyo,Xj)sujeto a: ∑yoyyohyo= 0 ,hyo≥ 0