De hecho, has encontrado una pregunta abierta en la literatura. Como usted dice, hay una variedad de núcleos (por ejemplo, lineal, función de base radial, sigmoide, polinomio), y realizará su tarea de clasificación en un espacio definido por sus respectivas ecuaciones. Que yo sepa, nadie ha demostrado definitivamente que un núcleo siempre se desempeña mejor en un tipo de tarea de clasificación de texto en comparación con otro.
Una cosa a tener en cuenta es que cada función del kernel tiene 1 o más parámetros que deberán optimizarse para su conjunto de datos, lo que significa que, si lo está haciendo correctamente, debe tener una segunda colección de entrenamiento de retención en la que pueda Investigue los mejores valores para estos parámetros. (Digo una segunda colección de espera, porque ya deberías tener una que estés usando para descubrir las mejores características de entrada para tu clasificador). Hice un experimento hace un tiempo en el que hice una optimización a gran escala de cada uno de ellos. estos parámetros para una tarea de clasificación textual simple y encontraron que cada núcleo parecía funcionar razonablemente bien, pero lo hizo en diferentes configuraciones. Si recuerdo mis resultados correctamente, sigmoid funcionó mejor, pero lo hizo con ajustes de parámetros muy específicos, que me tomaron más de un mes para encontrar mi máquina.