El truco del kernel se usa en varios modelos de aprendizaje automático (por ejemplo, SVM ). Se introdujo por primera vez en el documento "Fundamentos teóricos del método de función potencial en el aprendizaje de reconocimiento de patrones" en 1964.
La definición de Wikipedia dice que es
un método para usar un algoritmo de clasificador lineal para resolver un problema no lineal mapeando las observaciones no lineales originales en un espacio de dimensiones superiores, donde el clasificador lineal se usa posteriormente; Esto hace que una clasificación lineal en el nuevo espacio sea equivalente a una clasificación no lineal en el espacio original.
Un ejemplo de un modelo lineal que se ha extendido a problemas no lineales es el kernel PCA . ¿Se puede aplicar el truco del núcleo a cualquier modelo lineal o tiene ciertas restricciones?