Estoy un poco confundido con la diferencia entre un SVM y un perceptrón. Permítanme tratar de resumir mi comprensión aquí, y siéntanse libres de corregir dónde estoy equivocado y completar lo que me he perdido.
El Perceptron no intenta optimizar la separación "distancia". Mientras encuentre un hiperplano que separe los dos conjuntos, es bueno. SVM por otro lado intenta maximizar el "vector de soporte", es decir, la distancia entre dos puntos de muestra opuestos más cercanos.
El SVM generalmente intenta usar una "función de núcleo" para proyectar los puntos de muestra en un espacio de alta dimensión para hacerlos linealmente separables, mientras que el perceptrón asume que los puntos de muestra son linealmente separables.